岗位职责:
1)主导并实施老系统的容器化与云原生改造
评估和分析传统老旧应用的系统架构、依赖关系和运行状态,制定可行的容器化迁移方案与实施路径。主导完成应用的Docker镜像化改造、Helm Chart封装,并解决在迁移过程中遇到的网络、存储、配置等差异化问题。设计并实现状态应用、中间件等复杂系统的容器化方案,确保其在高可用、性能和可维护性上达到预期目标。
2)为业务应用提供容器化与云原生解决方案
指导和协助开发团队完成新应用的容器化部署,提供最佳实践指导。
设计和实现服务发现、负载均衡、网络策略、存储方案等,保障应用在容器平台上的高效、稳定运行。
3)构建并运维平台的监控、日志与告警体系
构建覆盖混合云多集群的立体化监控、日志与告警系统,实现全局可观测性。
建立统一的监控大盘和告警链路,具备快速定位跨云、跨集群故障的能力。
4)保障整体系统的可靠性
设计高可用架构、容量规划、制定可观测性标准(监控/日志/链路追踪)、编写基础设施即代码、进行混沌工程实验。高效处理告警和故障、执行应急预案。主导或参与故障复盘、根因分析、推动修复措施落地、优化自动化工具和流程。
任职要求:
1.容器化与迁移能力:精通应用容器化(Docker)与云原生部署(Helm),能够主导完成传统应用向容器平台的迁移与复杂有状态服务的容器化改造。
2.云原生技术栈:掌握服务发现、负载均衡、网络策略等云原生核心组件的设计与实现,能为业务应用提供稳定可靠的运行环境。
3.平台可观测性:具备构建覆盖多集群的监控、日志与告警体系的能力,实现全局故障快速定位与诊断。
4.高可用与自动化运维:擅长设计高可用架构与可观测性标准,能通过基础设施即代码、混沌工程和自动化流程保障系统可靠性并高效处理故障。
5.计算机软件相关专业,本科及以上学历,年龄在35周岁以下。
6.适应长期出差、高压力环境下工作,快速适应企业文化。