职位描述
岗位职责
1.基础设施管理
负责混合云(公有云+私有云/IDC)及Kubernetes集群的规划、部署与稳定性保障,确保资源高效利用与系统高可用;支持大数据组件(如ES/Kafka/Hadoop)的运维与性能观测,并协助完成业务系统的部署上线与日常IT支持;
2.自动化与工具开发
使用Python/Shell/Go等语言开发运维自动化脚本与工具,主导CI/CD流水线的构建与优化,通过推动DevOps实践提升研发团队的交付效率与质量;
3.监控与稳定性保障
构建并维护基于Prometheus/ELK等的全方位监控告警体系,负责系统容量规划、性能调优与成本控制,并制定完善的灾备与应急预案,保障业务连续性;
4.运维流程与安全
建立并持续优化运维规范、流程及文档体系,主导系统的安全加固、漏洞修复与合规实施,提升整体运维工作的标准化与安全性水平。
任职要求
1.5年以上运维经验,熟悉中大型复杂系统及微服务架构运维,精通Linux系统调优及故障排查;
2.至少熟练掌握一种脚本语言(Python/Shell/Go),具备Docker与Kubernetes生产环境实践经验,熟悉华为云管理及Prometheus/Zabbix/ELK等监控系统与CI/CD工具链;
3.具备大数据/AI基础设施、网络(TCP/IP/VPN/负载均衡)或安全运维/等保合规相关经验者优先;
4.具备高度责任心、抗压能力和优秀的问题解决能力,善于沟通协作,拥有主动学习和分享的热情,并注重流程规范与文档沉淀。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕