工作地点:海淀木樨园
岗位职责:
作为运维团队的技术引擎,通过设计、开发、整合自动化工具与平台,赋能信息自动化系统运维,提升运维工作效率、规范性、可度量性与自助化水平,实现运维工作的平台化、服务化与智能化,保障业务系统的稳定运行。
运维平台维护:负责中线公司自动化运维平台维护与迭代,根据运维业务需求维护信息自动化运维平台,包括资源管理、流程管理、监控预警、运维管理等模块。
工具链开发与集成:开发各类运维小工具、脚本库和API服务,并将工具及脚本集成到自动化运维平台,不断提升信息系统运维自动化水平。
监控与告警与自动化处置:维护信息化设备设施监控,适配开发新基础设施、应用、业务的监控模板,不断完善监控指标,并通过人工智能等手段实现告警收敛、根因分析、故障自愈等功能,提升告警的准确性和故障响应速度。
能力输出:为传统运维人员和开发人员提供工具平台的技术支持与培训,推动自动化文化,提升传统运维人员自动化运维能力。
1.扎实的计算机理论基础,熟悉数据结构、算法、网络通信、操作系统原理、数据库原理及软件工程方法。
2.精通至少一门后端开发语言,Python/Go/Java,熟练掌握至少一种Web开发框架,如 Django/Flask(Python)、Gin/Beego(Go)、Spring Boot(Java),并有实际开发经验。
3.具有自动化运维平台、IT运营平台(ITSM)、运维中台或类似产品的开发或核心模块维护经验,熟悉平台常见功能的开发,如资源管理(CMDB)、工单流程引擎、权限控制(RBAC)、Dashboard可视化等模块的设计与实现。
4.深入理解运维场景,能熟练使用Ansible、SaltStack等自动化工具,并具备将其能力封装为API或集成到平台的实践经验,具备将各类运维脚本、工具服务化、平台化的能力,能通过API网关、微服务等方式提供统一服务。
5.熟悉主流监控监控模板、插件开发经验,对告警收敛、根因分析(RCA)、故障自愈等AIOps场景有技术理解或初步实践,了解相关算法或实现思路。
任职要求
学历背景:本科及以上计算机科学与技术、软件工程、信息技术、信息安全、密码学等相关专业;
工作经验:5-10年以上相关工作经验,需具备同类项目建设或维护经验,如:运维自动化平台开发。