5000-7000元
富力中心42-43
岗位职责:
一、运维体系化建设
1. 主导云平台运维业务能力规划,制定技术发展战略,推动新业务场景落地,确保业务目标达成。
2. 组织实施云平台智能运维体系建设,涵盖业务连续性保障、运维架构优化、全链路监控体系(指标 / 日志 / 追踪)、自动化故障处理及风险管理,引入 AIOps 技术实现异常检测与根因分析。
二、运维问题支撑:
1、实现日常运维自动化(巡检/备份等)、故障自愈及智能容量规划,通过自动化手段实现客户SLA的要求
2、解决云平台复杂疑难问题(如大规模容器集群性能瓶颈、分布式存储故障排查),预研前沿技术(如 Serverless、边缘计算、智能网卡)并推动落地。
3. 与开发、安全、产品团队紧密协作,推动 DevOps 文化落地,建立跨团队高效沟通机制(如定期技术对齐会、故障复盘会)。
三、团队管理和技能提升
1、分析团队运维质量数据(如SLA达成率),制定针对性改进措施,定期开展技术培训与赋能,提升团队整体技术水平。
2、负责网络团队的建设和日常管理,对团队的目标达成负责,保障项目的交付质量和客户满意度。
四、技术规划和技术预研
1、设计并落地混沌工程实践,通过故障注入实验验证系统韧性,优化容灾策略,提升云平台可靠性(如跨 Region 容灾、自愈系统设计)。
2、负责重大运维技术方案制定(如混合云架构设计、容器化部署优化),参与云平台架构评审,确保技术方案的安全性、可扩展性及成本效益。
五、客户交流和影响力提升
1、与重要客户开展技术交流,理解业务需求,提供定制化运维解决方案,提升客户满意度与技术信任度。
任职要求:
核心能力:
1. 熟悉云计算产品的架构原理,具备云平台资源性能管理及优化的丰富经验,具备万台规模以上云平台运维经验。
2. 熟悉云计算技术架构,有丰富的云计算产品研发经验,有过多年保障业务平台的技术系统架构设计的工作经验,熟悉应用架构设计与软件开发流程。
3. 熟悉云计算、虚拟化、容器以及自动化编排技术,有openstack、kvm、Kubernetes、Docker、Linux 等社区开发经验优先。
4. 具备有分布式存储软件、SDN软件的开发或维护经验,熟悉分布式存储和SDN的架构原理。
5. 精通云计算(云平台、网络、SAAS)相关技术,掌握公有云、私有云领域整体技术架构
6. 熟练掌握脚本语言编程方法,至少精通一门开发语言经验C/Python/Go等。熟悉业界主流的开发框架,精通devops开发模式实战经验。
7. 精通云平台运维工具及相关运维流程
8. 理解 SRE 方法论,掌握服务等级管理(SLO/SLA)、容量规划(如 Kubernetes HPA)、故障根因分析(RCA),有 AIOps 平台(如 Dynatrace)或机器学习在运维中应用经验优先。
工作经验:有5年以上相关工作经验
教育背景要求: 统招本科以上学历
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕