职位描述
岗位职责:
一、日常运维保障
负责7*24 Oncall事件响应及SLA达标
执行系统故障定位、修复及变更管理
二、自动化运维
实施监控告警体系建设及灾备演练
主导OS补丁升级及资源优化配置
三、运维平台开发
开发自动化巡检工具及运维看板
搭建监控中心/用户支持中心可视化作战平台
四、运营分析
编制周期性运维报告,输出风险分析及优化建议
岗位要求:
本科及以上学历,计算机相关专业(能力强学历可放宽大专)
3年以上中大型系统运维经验,熟悉ITIL体系
熟悉WeOps运维体系,具备看板开发经验
掌握Ansible/Prometheus/Grafana等工具链
熟悉DevOps理念及CI/CD流程
持有HCIE/RHCE,有大型互联网公司SRE经验优先
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕