职位详情
资深云原生DevOps工程师
1.6-3万
长安通信科技有限责任公司
北京
5-10年
本科
01-13
工作地址

TBD云集中心16号楼长安通信科技有限责任公司

职位描述
工作职责:
1.云原生体系架构:负责公司级云原生技术栈的架构设计与演进,主导Kubernetes集群规划、服务网格(Istio/Linkerd)落地与Serverless化探索,推动云原生技术在AI、大数据、微服务等平台的深度应用。
2.现代化交付体系建设:设计并实施企业级CI/CD平台,精通Jenkins/GitLab CI流水线编排,主导GitOps实践落地(ArgoCD/Flux),实现基础设施即代码(IaC)与交付流程自动化,支撑多业务线敏捷迭代。
3.可观测性与SRE实践:构建统一监控告警体系,整合Prometheus+Grafana+AlertManager,设计全链路追踪与日志聚合方案,主导SLI/SLO定义与错误预算管理,推动故障演练与混沌工程常态化。
4.性能工程与成本优化:建立性能压测标准流程,设计全链路压测平台,分析系统瓶颈并推动优化;实施资源成本治理,通过FinOps实践实现云资源利用率提升与成本可控。
5.多环境适配与标准化:主导异构环境(公有云/私有云/混合云)适配,推动国产化技术栈标准化;维护公司级Helm Chart仓库与Operator生态,沉淀可复用的部署模板。
6.技术赋能:作为云原生技术专家,开展SRE/DevOps培训与认证,培养工程师梯队
任职要求:
1.云原生深度专家:5年以上云原生领域经验,有生产级Kubernetes集群(500+节点)架构设计与运维经验,熟悉控制平面组件(API Server/Scheduler/Controller Manager)调优与二次开发
2.精通CI/CD与GitOps:主导过3个以上大规模Jenkins/GitLab CI流水线建设项目,熟悉Pipeline as Code;精通ArgoCD/Flux,有GitOps在多集群、多环境落地的实战经验。
3.可观测性体系:深度掌握Prometheus Operator、Thanos/Cortex架构,有大规模监控指标(10万+)优化经验;熟悉OpenTelemetry标准,具备分布式链路追踪与日志聚合实战能力。
4.性能调优能力:有全链路压测平台(如JMeter/K6/TPC-C)建设经验,能分析JVM、内核、网络、存储瓶颈并提出优化方案。
5.信创与多云经验:有信创项目国产化适配经验,熟悉鲲鹏/昇腾生态;具备多云(阿里云/腾讯云/华为云)环境交付能力。
优先条件:
1.有AI/MLops平台或大数据平台云原生改造经验
2.主导过Service Mesh大规模落地(100+微服务)

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请