工作职责:
1.全面保障云业务稳定运行,主导构建监控告警、故障诊断、巡检及应急预案体系,提升系统可靠性与响应能力。
2.凭借开发经验,自主研发自动化运维系统与工具,设计标准化运维流程,有效提高运维效率与质量。
3.制定并完善线上变更、告警处理、问题复盘等流程体系,推动其在实际工作中落地执行,实现运维管理规范化。
任职要求:
1.具备扎实的计算机专业基础,深入理解计算机体系结构、操作系统、网络、存储、虚拟化等,拥有强大的运维自动化能力,熟知 IaaS 底层原理。
2.熟悉云基础产品服务架构,在云计算、云网络、存储、云原生等领域积累丰富实践经验,能有效应对各类业务场景。
3.熟练掌握 Shell、Python、Golang 等一门或多门开发语言,可通过编程实现运维任务的自动化与高效化处理。
4.具备独立工作能力,能对复杂问题进行综合分析与解决,善于在压力下推进工作,保障业务稳定运行。
5.若熟悉 DPU 智能网卡软硬件架构或可编程交换芯片架构,可在云基础设施优化等工作中发挥专业优势,优先考虑。
6.熟悉 React、Vue、AngularJS 等前端框架,能够在运维可视化等开发场景中提供技术支持的优先。
工作地点成都、北京、上海不限