4000-5000元
中国电信太原算力中心
岗位描述:
1.搭建和维护监控系统,制定监控指标(CPU/内存/磁盘/网络/业务埋点),实现异常告警精准推送;分析监控数据,定位系统瓶颈(如慢查询、资源泄漏),输出容量规划报告。
2.响应生产环境故障(服务器宕机、服务雪崩、网络抖动),执行应急预案(熔断、降级、扩容),编写故障复盘报告;通过日志分析、链路追踪定位根因,推动代码/架构优化。
3.开发运维工具链,实现服务器批量部署、配置管理、日志采集自动化;构建CI/CD流水线,支持微服务持续交付与灰度发布,推动运维体系建设。
4.管理Kubernetes集群,排查容器化应用异常;设计流量治理方案,实现金丝雀发布、故障注入等高级策略。
5.设计多活架构,实施数据库主从同步、异地灾备演练。
6.领导交办的其他事宜。
岗位要求;
1.本科及以上学历,计算机、网络工程等相关专业。3年以上运维经验,主导过系统全生命周期运维,设计过高并发系统架构,具备故障应急实战经验。
2.精通Linux内核调优(文件系统/网络参数)、Shell/Python脚本开发,熟悉Ansible自动化框架;掌握Nginx/Tomcat/Apache调优,熟悉Redis/Memcached缓存集群运维。
3.熟练部署K8s集群,掌握Helm Chart打包与升级,熟悉一种以上监控方案。
4.熟悉主流数据库主从复制、分库分表,熟练掌握一种以上数据库维护工具;能编写复杂SQL优化索引,实施物理备份与binlog增量恢复。
5.熟悉TCP/IP协议栈、iptables防火墙规则,掌握ELK日志分析体系。
6.主导过AIOps落地(如异常检测模型、自动化工单系统)者优先;熟悉混沌工程,推动系统韧性建设者优先。
福利待遇:五险一金,体检,带薪年假,双休,通信补贴,餐补,交通补贴,节日福利等
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕