职位描述
一、岗位职责
- 集群运维与管理:负责大型 K8S 集群日常监控、部署、扩容及故障处理,保障高可用性与稳定性。
- 性能优化:分析集群瓶颈,优化资源调度、网络、存储及安全策略(RBAC / 网络策略)。
- 架构设计:规划 K8S 集群架构,提供容器化迁移、多集群 / 混合云部署方案,制定标准化规范。
- 自动化工具开发:设计运维脚本及工具(如 Ansible/Python/Operator),集成监控(Prometheus/Grafana)与 CI/CD 流水线。
- 技术支持:协作研发团队推进应用上云,输出技术文档并提供内部培训。
二、任职要求
- 核心技能:
- 5 年 + IT 运维经验,3 年 + K8S 实战经验(含大型生产集群管理),精通核心组件(API Server/etcd/kubelet)、容器运行时(Docker/Containerd)及生态工具(Helm/kubectl)。
- 熟悉容器网络(CNI)、存储(PV/PVC/CSI)、安全(RBAC/PSP)及性能调优(HPA / 资源配额)。
- 掌握主流云平台(AWS EKS / 阿里云 ACK 等)、CI/CD 工具及 Shell/Python 脚本开发。
- 经验要求:
- 具备 K8S 集群架构设计、容器化迁移或多集群管理经验,有复杂故障处理案例优先。
- 持有 CKA/CKS 等 K8S 认证或云平台认证(AWS / 阿里云)优先。
- 软技能:
- 高效沟通与客户服务意识,能快速定位解决技术问题,适应高压环境。
- 团队协作能力强,主动沉淀技术经验,英语读写良好(能阅读官方文档)。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕