职位描述
职位描述
我们正在寻找一位经验丰富的DevOps工程师,加入我们快速发展的AI技术团队。您将负责构建和维护我们的AI系统架构。
核心职责:
基础设施管理
负责Kubernetes集群的规划、部署和维护,管理容器化应用的生命周期,确保生产环境的稳定运行
自动化运维
使用Python开发自动化运维工具,建设CI/CD流水线,提升部署效率和代码质量
监控告警
构建完善的监控体系,设计合理的告警策略,快速定位和解决系统问题
性能优化
持续优化系统性能,进行容量规划,制定扩容缩容策略
安全运维
确保系统安全性,制定备份容灾方案,参与应急响应处理
任职要求
必备技能:
编程能力
熟练掌握Python编程,具备脚本开发和工具开发能力,了解Go/Shell等语言
容器技术
深度掌握Kubernetes和Docker技术,熟悉Helm、Istio等云原生工具栈
运维基础
熟练使用各种运维工具和监控平台,
熟悉代码接入Prometheus、Grafana、ELK等监控技术栈
CI/CD实践
熟悉Jenkins、GitLab CI、ArgoCD等工具,有完整的DevOps流程搭建经验
加分项:
有公有云(阿里云/AWS/腾讯云)使用经验
了解微服务架构和分布式系统
有IaC(基础设施即代码)实践经验
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕