职位描述
【岗位职责】
1. 负责公司 DevOps 平台、运维自动化流程的落地与持续优化,推进云原生架构下的部署、监控、交付体系建设;
2. 负责公有云环境下业务系统的安装、配置、资源管理与运行维护,包括部署调优、故障处理、数据备份、日志管理等;
3. 参与企业办公桌面环境运维支持,负责终端设备(Windows / macOS)配置,网络设备(如路由器、防火墙、VPN)及各地办公点网络基础设施的运维保障;
4. 快速响应各类突发系统事件与日常工单问题,协调相关团队解决故障,保障平台系统稳定运行。
【任职要求】
1.DevOps与效能工具链管理:
o 熟悉主流项目管理与研发效能平台(如阿里云云效、腾讯 TAPD、PingCode 等),掌握敏捷开发流程配置、工单/缺陷/工时管理与效能分析方法;
o 有混合云环境下的 DevOps 实施经验,能够支持多分支测试与版本环境协同。
2.监控体系建设:
o 能独立搭建和维护监控系统,如 Prometheus、Alertmanager、Grafana 等;
o 熟悉监控指标规则(Prometheus rules、Grafana dashboard),具备按需构建统一监控告警平台能力;
o 了解 OpenTelemetry、CloudWatch 等指标采集与链路追踪技术,具备多源数据监控集成和故障自动化响应能力。
3.系统与中间件运维:
o 熟悉 Linux 环境下常见服务部署与运维,如 Nginx、Redis、Kafka、MongoDB;
o 能够进行服务配置优化与性能调优,保障系统稳定性和扩展性。
4.云平台操作与管理:
o 熟练使用主流公有云平台(如 AWS、阿里云),掌握常用云产品(如 VPC、ECS/EC2、RDS、EKS、AnalyticDB、DataWorks、MaxCompute、Glue 等)的配置和管理;
o 具备跨平台混合云资源监控与统一管理能力。
5.网络与编程能力:
o 理解 TCP/IP 网络协议原理,具备故障排查与网络设备配置能力;
o 熟悉 Shell / Python / Go 中至少一种编程语言,具备脚本开发或运维工具开发经验者优先。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕