职位详情
sre运维工程师
8000-15000元·13薪
上海新炬网络信息技术股份有限公司
南京
1-3年
大专
01-15
工作地址

江苏移动网络部

职位描述
工作职责:
1.负责大型 IT 系统的站点可靠性工程工作,通过建立和完善监控体系、告警机制、自动化运维工具,保障系统的高可用性、稳定性和性能,确保系统服务水平达到预设指标(SLA)。
2.运用软件工程方法和工具,开发和维护自动化运维系统和工具,实现系统部署、配置管理、故障恢复、容量规划等运维工作的自动化和标准化,减少人工干预,提高运维效率和系统可靠性。
3.负责系统容量规划和性能优化,通过监控和分析系统运行数据,预测系统容量需求,提前进行资源扩容;识别系统性能瓶颈,进行性能调优,提升系统整体性能。
4.参与系统故障的排查和根因分析,制定故障应急预案并定期组织演练,提高团队应对故障的能力,减少故障对业务的影响;同时,总结故障经验教训,推动系统和流程的持续改进。
5.与开发团队紧密协作,将 SRE 理念和实践融入到软件开发流程中,在系统设计、开发、测试和部署阶段提供可靠性、可维护性方面的建议,确保系统从设计之初就具备高可靠性。
任职要求:
1.学历:专科及以上学历(本科优先),计算机、软件工程、电子信息等相关专业。
2.技能:
◦具有 2-3 年及以上大型分布式系统 SRE 或运维开发工作经验,熟悉 SRE 的核心思想、方法和实践,有互联网、金融科技等大型分布式系统 SRE 经验者优先。
◦熟练掌握至少一种脚本语言(Shell、Python、Go 等)和一种编程语言(Java、Go 等),能够独立开发自动化运维工具、监控脚本和故障处理程序。
◦深入了解 Linux 操作系统原理和性能优化方法,熟悉分布式系统架构(如微服务、云原生架构)和相关技术组件(如 Kubernetes、Docker、Prometheus、Grafana 等)。
◦具备较强的系统监控和故障排查能力,熟悉常见的分布式系统故障类型和处理方法,能够快速定位和解决复杂系统故障;了解容量规划方法和性能测试工具,能够进行系统容量评估和性能优化。
3.素质:具备强烈的责任心和服务意识,对系统可靠性有极高的追求;拥有良好的学习能力和创新精神,能够快速掌握新技术并应用到实际工作中;具备优秀的沟通协调能力和团队合作精神,能够与开发团队高效协作,共同提升系统可靠性。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请