工作内容:
(1)负责业务中台测试、预发布及生产全环境的搭建与维护工作;
(2)负责系统环境资源的监控告警、数据备份与恢复、问题定位跟踪及故障应急处理;
(3)负责K8s集群稳定性保障,主导中间件部署方案的优化设计与落地实施;
(4)负责项目运行阶段环境性能的监测分析、安全风险排查及优化迭代工作;
(5)负责系统相关运维文档的编制、审核与落地推行。
(1)8年及以上相关工作经验;具备复杂系统设计与推进经验;
(2)精通Linux操作系统,熟练运用各类Linux命令,具备运维脚本开发与编写能力;
(3)深入理解K8S集群核心概念与运行原理,具备生产级容器系统部署搭建与运维管理经验;
(4)熟练使用Prometheus、SkyWalking等监控工具,能独立完成K8S集群的监控配置与告警管理;
(5)熟练掌握MySQL、Redis、MongoDB、Elasticsearch等常用数据库的使用与运维;
(6)有大型项目现网运维实施经验者优先;有阿里公有云、私有云或混合云平台运维经验者优先;
(7)具备优秀的沟通协调能力与强烈的责任心,拥有良好的工作标准化流程梳理能力及规范的文档撰写习惯。