职位描述
岗位职责
1. 负责公司业务系统的运维管理,保障系统 7×24 小时稳定、高效运行,及时处理各类系统故障和突发事件,将系统停机时间控制在极低水平。
2. 设计并实施全面的自动化运维方案,涵盖自动化部署、监控、故障预警与修复等环节,提高运维效率,降低人为错误。
3. 对生产环境进行深度性能分析和优化,包括服务器性能、网络性能、存储性能等,提升系统整体性能,满足业务对系统响应速度和吞吐量的要求。
岗位要求
1. 具有 3 年以上高级运维工作经验,有大型复杂系统运维经验者优先,具备扎实的计算机基础知识。
2. 精通 Linux 操作系统,熟悉常用命令和脚本编程(如 Shell、Python 等),能够熟练进行系统配置、性能优化和故障排查。
3. 精通Kubernetes集群、Prometheus监控体系规划、部署与运维,具备脚本自动化、故障排查及性能调优能力。
4. 熟悉主流的自动化运维工具者优先,如 Ansible、Puppet、SaltStack 等。
5. 拥有较强的沟通能力、学习能力和解决问题的能力,能够快速掌握新技术和新工具。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕