职位描述
岗位职责:
一、岗位定位
对内:研发团队的“基础设施 + 工具链 + 文档”第一责任人
对外:现场项目实施、部署及故障定位的最后一道防线
二、核心职责
环境交付
• 负责开发、测试、预生产环境的 Linux 服务器、KVM/容器、中间件、数据库(MySQL/PostgreSQL/Redis/MongoDB)的安装、调优、备份与恢复。
• 以 IaC 方式(Ansible/SaltStack/Terraform)维护所有环境配置,确保一键重建。
DevOps 工具链
• 维护并二次开发 GitLab、Jenkins、SonarQube、Harbor、Nexus 等 CI/CD 工具;实现流水线模板化、自动扫描、制品晋级。
• 建设并运维监控告警体系(Prometheus + Grafana / Zabbix / ELK),打通业务日志、系统指标、应用 trace。
版本与发布
• 与开发合作制定分支策略、发布 checklist、回滚方案;产出可交付的《版本发布与部署实施文档》。
• 维护 helm chart / docker-compose / k8s yaml,支撑多项目并行定制的快速部署与差异化配置。
现场支持
• 支持客户现场部署、升级、故障定位,具备抓包、性能诊断、脚本热修能力。
• 对网络、VPN、DNS、SSL 证书等基础设施进行故障排查与优化。
文档与知识库
• 主导输出《运维手册》《环境交付标准》《故障排查 SOP》《上线审批流程》,并保持与代码同库版本化。
三、硬性要求
学历与经验
• 计算机相关专业本科及以上
• 5 年以上 Linux 运维 + DevOps 实战经验
• 有 10 人以上研发团队服务背景优先
操作系统与脚本
• 精通 Windows / Linux(CentOS/Ubuntu/Kylin)性能和网络调优、安全加固
• 熟练使用 Shell/Python编写自动化脚本,熟悉 Flask/Django 快速开发内部工具
容器与编排
• 熟练使用 Docker、docker-compose、Kubernetes
• 能编写调试 helm chart优先,具备线上 k8s 集群故障排查能力
CI/CD 与配置管理
• 深度使用 Jenkins、GitLab CI等,掌握蓝绿 / 灰度 / 滚动发布策略
• 熟悉 Ansible/SaltStack/Terraform 至少一种 IaC 工具
数据库与中间件
• 熟练部署与调优 Oracle、达梦等数据库,Redis、Nginx、Kafka/MQ、ELK等中间件
• 根据实际环境调整优化参数配置,实现高可用方案
网络与排障
• 掌握 TCP/IP、HTTP/HTTPS、DNS、SSL/TLS
• 能使用 tcpdump/wireshark、iftop、perf、strace 快速定位问题
文档与沟通
• 熟悉Markdown输出规范化文档,积极更新
• 持续学习,良好的跨团队沟通与培训能力
四、加分项
• 有 GitLab/Jenkins 插件或监控平台二次开发经验
• 参与过复杂遗留系统的环境标准化改造或多分支合并项目
• 能提供以往撰写的运维手册、故障案例或架构图(脚本、IaC 或工具项目)
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕