职位描述
项目环境
代码与发版平台:Tencent CODING DevOps(代码库/制品库/流水线/发布组件)
运行环境:Kubernetes(TKE 优先)、Docker、Nginx,后端 Django/Celery,前端 React
仓库与版本:Git,语义化版本与环境分层(dev/stage/prod)
岗位职责
设计与维护 CI/CD
基于 Jenkins 与 CODING 流水线构建/测试/制品管理/部署
编写 Jenkinsfile,集成单测、制品版本化、质量门禁与回滚
制作并优化容器镜像(多阶段构建、缓存、SBOM)
Kubernetes 运维
Helm/Kustomize 管理应用发布、配置与分环境参数
资源编排与治理:Deployment/StatefulSet、ConfigMap/Secret、PV/PVC、Ingress/Service
弹性与稳定性:HPA/VPA、PDB、亲和与污点、滚动升级/蓝绿/金丝雀
网络与安全:NetworkPolicy、TLS/证书、镜像与权限管理、RBAC
可观测性与故障处理
Prometheus/Alertmanager、Grafana 仪表盘;日志(ELK/Loki/CLS)、Trace(Jaeger/Tempo)
关键服务监控:Django、Celery、Nginx/Ingress、Redis/DB
制定并执行值班、应急响应、变更与回滚预案,产出Runbook/复盘
平台与云资源
CODING 制品库与镜像仓库(TCR/CODING Artifact),发布组件到 TKE
域名/DNS、证书、对象存储(COS)、负载均衡(CLB)与日志(CLS)
系统与安全
Linux 日常运维与性能调优,Shell 脚本与自动化
合规与安全基线:镜像扫描、依赖与漏洞管理、最小权限、密钥/证书管理
任职要求(必备)
3 年以上 Linux 运维/DevOps 经验,2 年以上 K8s 生产经验
熟练 Jenkins(Pipeline/Jenkinsfile/多分支)、CODING DevOps(流水线/制品/发布组件)
精通 K8s 核心对象与排障:kubectl/describe/logs/events、Helm/Kustomize、Ingress(Nginx)
熟练容器化与镜像优化,熟悉 TKE/TCR、CLB、COS、CLS 等腾讯云组件
掌握 CI/CD 最佳实践:环境分层、蓝绿/金丝雀、回滚、制品与版本策略
可观测性体系:Prometheus/Grafana、ELK/Loki、告警编排与SLO
网络与安全:TLS/证书链、RBAC、NetworkPolicy、镜像与依赖安全
基础中间件:MySQL/PostgreSQL、Redis 的备份、监控与高可用
基础脚本能力(Bash/Python 其一),Git 工作流与代码评审习惯
重视稳定性与可维护性:文档完备、变更可审计、配置可追溯
沟通与协作:对接研发/测试/产品,推动问题闭环
结果导向:明确SLA/SLO/错误预算,度量驱动改进
责任心与当值:故障响应、复盘与持续改进
加分项
GitOps(Argo CD/Flux)、基础设施即代码(Terraform/Ansible)
外部密钥管理与策略:External Secrets、Vault、OPA/Gatekeeper/Kyverno
Service Mesh(Istio/Linkerd)、零信任网络
成本优化与容量治理:Cluster Autoscaler、资源配额、Spot/预留实例
Nginx/Ingress 对 SSE/长连接的生产优化经验(缓冲、超时、连接复用)
面试/作业建议(任选)
基于 CODING + Jenkins 实现一条到 TKE 的端到端流水线:构建镜像→推送制品→Helm 部署→一键回滚
为某服务编写 Helm Chart(含 dev/stage/prod values),配置 HPA 与 PDB,并演示滚动升级与回滚
搭建监控告警:为 5xx 错误率与 P95 响应时间设置告警,提供 Grafana 看板与 Runbook
配置 Nginx/Ingress 以支持 SSE/流式响应,给出断路与超时策略
关键词 :
Jenkins、CODING DevOps、Kubernetes/TKE、Helm/Kustomize、Docker/TCR、Nginx/Ingress、Prometheus/Grafana、ELK/Loki、RBAC/NetworkPolicy、TLS、GitOps、Terraform/Ansible、COS/CLS/CLB
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕