职位详情
高级云平台运维开发工程师
2-3万
同创双子(北京)信息技术股份有限公司
深圳
5-10年
本科
03-31
工作地址

深圳湾科技生态园n

职位描述
职责描述:
1、多云环境运维保障:负责AI云平台在多云环境下的日常运维,确保跨云资源的高可用性、安全性与成本优化。
2、 GPU集群运维与性能调优:管理GPU集群的日常运维,监控GPU资源利用率、任务调度状态及异常告警。。
3、云原生运维体系构建:基于Kubernetes、Docker等实现容器化服务的自动化部署、扩缩容及版本灰度发布。
4、运维自动化与DevOps实践:开发运维脚本(Python/Shell)及Ansible/Terraform等工具链,提升CI/CD流程效率。
5、容器镜像仓库服务搭建管理、分层镜像管理;
6、跨层协同与优化: 全链路监控、运维自动化、故障定位处理等

任职要求:
1、教育背景:计算机科学、网络工程或相关专业本科及以上学历。
2、精通至少一种公有云(AWS/Azure/GCP)运维,熟悉VPC、IAM、负载均衡等核心服务。
3、精通Kubernetes集群管理,包括但不限于网络策略、存储方案、服务编排,具备故障排查、性能调优及安全加固经验。
4、熟练使用运维工具链:Prometheus/Zabbix、Ansible/Terraform、Jenkins/GitLab CI等。
5、熟悉GPU/NPU硬件运维,了解NVIDIA DCGM、GPU监控工具或集群管理框架(如KubeFlow)。
6、熟练使用Python 进行自动化脚本/工具开发。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请