职位描述
岗位职责:
1.负责项目的基线管理、版本管理、发布管理,负责编译、打包、发布的流程管理,发现并解决版本发布相关的问题;
2.及时响应各种故障报警,能够快速解决问题恢复业务;
3.主动发现生产环境的问题和隐患,通过开发或推进自动化运维工操作的维护成本;
4.负责系统灾备和恢复方案定制机落实,实际参与灾备演练,保障业务的稳定可靠运行。
任职要求:
1.熟悉Linux系统,3年以上Linux系统管理经验,大型Web平台运维经验优先考虑;
2.熟练掌握夜莺、Prometheus或Grafana至少一中工具的使用;
3.Elk、tidb、mongo、kafka集群等常用服务的集群架构、部署、配置调优;
4.能够使用Python或shell编写一些运维脚本,参与过自动化运维平台开发者优先,熟练掌握Ansible自动化工具
5.具备较好的沟通能力,文档整理能力,较强的自我驱动能力,追求极致的责任心。
加分项:
1.对linux有深入研究者优先;
2.能独立分析及解决问题,责任心强,积极主动,热爱学习,有良好的沟通能力和团队合作能力;
3.具备安全运维相关经验者优先;
4.熟悉大型互联网公司架构,熟悉Nginx,Redis,消息队列,等常用中间件等基础组件;
5.有千台以上服务器运维管理经验者优先;
6.擅长梳理关键监控指标及故障定位者优先;
7.有3~5年OpenStack运维经验者优先。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕