职位描述
岗位职责:
(1)系统部署与上线:负责软件系统从开发环境到生产环境的全流程部署,搭建并维护服务器、网络、数据库等基础设施;使用Jenkins、GitLab CI/CD 等工具实现自动化部署,保障多环境配置一致性。
(2)日常监控与维护:搭建并管理Prometheus、Zabbix等监控体系,实时监测系统资源使用、服务性能等关键指标;及时响应并处理服务器宕机、服务崩溃等突发故障,制定并执行故障应急预案。
(3)性能优化与容量管理:分析系统性能瓶颈,优化数据库查询、中间件参数及应用服务器配置;结合业务增长需求,制定服务器、存储等资源的容量规划方案,实现弹性扩展与成本优化。
(4)自动化与工具开发:编写Shell、Python等脚本实现运维任务自动化,参与或主导内部运维管理平台的开发与优化;推动DevOps流程落地,提升团队协作效率。
(5)安全与合规管理:制定并实施系统安全策略,包括防火墙配置、权限管理、数据加密等;定期进行数据备份与恢复演练,确保系统符合等保2.0、GDPR等合规要求。
(6)技术支持与协作:为业务部门、开发团队及客户提供技术支持,协助复现和解决线上问题;编写运维文档,沉淀技术经验,定期开展内部技术分享。
(7)特殊场景保障:负责重大活动、节假日期间的系统稳定性保障;主导或参与系统迁移、架构升级、容灾演练等复杂项目,制定并执行详细方案等。
任职资格:
(一)学历要求
本科及以上学历,计算机科学与技术、软件工程、网络工程等相关专业。
(二)专业技能
(1)熟练掌握Linux系统管理及Shell脚本编写,熟悉Windows Server基础运维;
(2)精通MySQL等至少一种关系型数据库,具备性能调优、备份恢复经验;熟悉Redis、MongoDB等NoSQL数据库;
(3)熟悉网络原理及常用协议(TCP/IP、HTTP),能独立配置Nginx、Apache、负载均衡器等网络组件;
(4)具备容器化技术(Docker)及Kubernetes集群管理经验,熟悉电信天翼云部署使用经验者优先;
(5)熟练使用Prometheus、Grafana、ELK Stack等监控与日志分析工具;掌握至少一门编程语言(Python等)用于自动化脚本开发;
(6)了解信息安全技术,如防火墙策略、WAF配置、数据加密等,熟悉等保2.0、3.0等合规标准;
(二)经验要求
(7)3年以上软件运维工作经验,具备大型分布式系统、高并发场景运维经验者优先;
(8)有DevOps实践经验,熟悉CI/CD流程及相关工具链(如Git等);
(9)具备数据库分库分表、微服务架构运维经验,参与过系统迁移、容灾建设项目者优先;
(三)其他要求
(10)具备良好的问题分析与解决能力,能快速定位并处理复杂技术故障,责任心强;
(11)具备优秀的沟通协调能力,能与开发、测试、业务等多部门高效协作;具备良好的文档编写习惯;
(12)持有相关专业认证者(如RHCE、CISP等)优先;
(13)北京属地人员优先;能够适应出差。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕