服务职责:
1. 需求分析与系统设计 深度挖掘 SRE 运维场景需求(如自动化修复、容量规划、混沌工程),输出业务流程图与痛点分析报告。 设计可观测性方案(日志/指标/链路追踪),主导埋点实施与数据看板开发(Python/Shell 脚本实现)。
2. 技术方案设计与交付 输出 SRE 技术解决方案文档(PRD/MRD),含交互逻辑设计(Axure/Visio)及自动化架构图(XMind)。 编写 Java/Python/Shell 自动化脚本原型(如故障自愈、资源调度),确保与开发团队技术落地对齐。
3. 项目管理与跨团队协同 主导 SRE 项目全周期管理(需求→交付),协调开发/测试/SRE 团队资源,把控进度与风险。 组织 故障复盘会议(Post-mortem),推动生成改进措施并纳入自动化体系(如通过 Python 实现规则引擎)。
4. 技术交付与运维支持 负责智网 SRE 项目交付,包括: 编写 Ansible/Shell 自动化部署脚本; 基于 Python 开发监控告警联动工具(如对接 **********+企业微信); 优化 Java 应用性能(GC 调优、线程池配置)。 提供生产环境重大故障的技术攻坚支持,主导根因分析(RCA)。
5. 数据驱动与持续优化 通过运营数据分析(SQL/Python 数据处理)推动 SLO/SLA 提升,制定容量规划策略。构建自动化运维知识库,沉淀 Shell/Python 工具链,降低重复性运维工作量。
服务要求:
一、任职资格要求
1. 知识技能
(1)学历经验: 研究生2年/本科4年/专科6年以上技术项目经验,计算机、通信、自动化相关专业优先。
(2)专业能力: 具备完整产品生命周期管理或大型技术项目交付经验(如SRE/DevOps/云平台类项目)。 技术栈要求: 精通 Shell 脚本开发(自动化部署、日志分析、运维监控)。 熟练掌握 Python(自动化工具开发、数据分析脚本、API集成); 有 TensorFlow/PyTorch 应用经验优先。 熟悉 Java 后端技术栈(Spring Boot 微服务架构调试、JVM 性能优化、日志分析)。 数据库能力:熟练使用 MySQL(SQL 优化、灾备方案设计)、了解 NoSQL 技术。 工具链:精通 Axure/XMind/Visio 输出技术方案,熟练使用 Git/Jenkins/K8s 等 DevOps 工具。
(3)优先项: 熟悉云平台架构(AWS/Azure/GCP)、监控体系(**********/Grafana)及通信资源管理业务。
2. 综合素质 逻辑清晰,具备技术方案设计能力与用户体验优化思维; 强大的跨部门协调能力,可独立推动技术项目闭环; 主动性问题解决意识,能识别系统瓶颈并提出工程优化方案; 抗压能力强,适应敏捷迭代与7×24响应支持。