职位详情
运维保障部负责人
2.5-3.5万
首信云技术有限公司
北京
5-10年
本科
08-29
工作地址

量子银座北京市海淀区知春路23号量子银座11层(知春路地铁站F东北口步行350米)

职位描述

一、岗位职责

1.负责云运维团队的日常管理,制定团队工作计划与目标,合理分配工作任务,确保团队高效运转,定期组织团队例会,同步工作进展、解决执行难点,提升团队协作效率,保障云平台运维服务水平。

2.根据团队成员技能短板,制定针对性培训计划(自动化运维工具、安全防护等方向),提升团队整体技术能力。建立人才晋升通道与绩效评估体系,激励成员成长,保留核心技术人才。

3.建立故障分级响应机制,牵头处理重大云平台故障(如服务中断、数据丢失、网络故障等),快速定位问题并制定解决方案,降低故障对业务的影响,事后组织故障复盘,输出复盘报告并优化预防措施。

4.建立完善的故障分级响应机制与复盘流程,能通过故障复盘总结经验,输出优化方案,避免同类问题重复发生。

5.负责云建立和完善规范化的运维流程体系,制定和改进应急预警方案、策略和流程,保障运维服务质量。

6.负责各云平台日常巡检、性能监控与资源调整,保障云平台7×24小时稳定运行;定期进行数据备份与恢复演练,确保业务数据安全性与可恢复性。

7.确保云运维工作符合行业(政务云监管、网信办安全审查)监管要求,定期组织云平台资质复评,制定合规性检查清单并定期开展自查,配合外部审计机构完成合规审计。

8.推动云运维技术创新,如引入AIOps工具实现故障智能预测、基于云原生技术优化运维架构等,提升运维效率与云平台的智能化水平。​

9.完成领导交办各项工作。


二、任职要求

1.本科以上学历,至少5年以上云计算或IT运维相关工作经验,其中3年以上团队管理经验。

2.精通主流云厂商云平台产品和服务,包括但不限于计算(ECS、EC2)、存储(对象存储、块存储、文件存储)、网络(VPC、负载均衡SLB/ELB、CDN)、数据库(云数据库RDS、NoSQL数据库)等。

3.掌握云安全核心技术、网络安全防护(WAF、DDoS高防、安全组)、漏洞扫描与渗透测试,能独立设计云平台安全防护方案。

4.具备极强的故障分析与定位能力,能快速响应云平台重大故障(如服务中断、数据丢失、大规模网络故障),最小化故障对业务的影响。

5.具备优秀的团队统筹与目标管理能力,能根据业务优先级制定团队工作计划,合理分配任务,激发团队成员积极性,确保团队高效达成运维目标。

6.具备强烈的责任心与抗压能力,能适应7×24小时运维值班需求(含节假日应急响应),面对紧急故障与高强度工作时保持冷静高效。

7.擅长技术文档编写与知识传递,能输出高质量的运维手册、故障复盘报告、合规检查清单,提升跨部门协作效率。

8.具备敏锐的风险洞察能力,能定期梳理云运维过程中的潜在风险(如资源瓶颈、安全漏洞),制定前瞻性的风险防控方案,提前规避问题。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请