职位描述
岗位职位
1、负责云资源交付,交付虚拟机、网络、数据库、存储等资源,协助厂商部署系统;
2、负责同客户以及与相关领域沟通,推动交付项目技术问题的解决;
3、负责平台的版本发布、系统部署、异常现象分析,故障定位,解决跟进;
4、负责优化监控体系与应急预案体系,提升监控效率,缩短故障定位时长;
5、参与平台架构优化、容灾优化、性能优化等建设,编写运维文档,包括操作手册、故障处理文档等;
技能要求:
1、熟悉主流的阿里云、腾讯云、华为云等云平台,有云交付经验者优先;
2、 熟悉TCP/IP、HTTP等协议,有良好的虚拟机、数据库、网络、存储、安全方面的知识;
3、至少5年以上平台系统运维经验,有大型互联网平台、大规模服务集群、高并发应用的运维保障经验者优先;
4、熟悉Prometheus/Zabbix等监控管理工具,熟悉自动化运维,熟悉docker/k8s/ocp容器运维优先;
5、熟悉shell/Java/python/ansible等语言,能编写常用的运维自动化工具;
6、具备较强的沟通能力和团队合作精神,高度的责任心,能够胜任7*24小时故障响应及处理。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕