职位详情
全栈运维工程师(中/高级)
1-2万
创意信息
成都
5-10年
本科
07-28
工作地址

AI创新中心

职位描述
岗位职责:
1.负责云平台(如AWS、Azure、华为云等)及AI算力服务器(GPU/TPU集群)的运维与监管,确保计算资源稳定高效运行
2.负责AI算力集群的部署.扩容.性能调优及故障排查,解决硬件驱动.容器调度(如Kubernetes)等相关问题
3.负责云资源与AI算力的容量规划,根据业务需求动态调整资源分配,持续优化资源利用率
4.编写自动化运维脚本(Python/Shell)及使用管理工具(如Ansible),实现云环境与AI服务器的批量运维
5.制定并执行数据备份.灾难恢复计划,保障云存储与AI训练数据的安全性
6.对接研发团队,协助解决AI模型训练.推理过程中的算力资源相关问题
7.完成领导安排的其他工作
任职要求:
1.计算机、软件工程、网络工程相关专业本科及以上学历,5年以上华为、阿里云平台运维经验,具备AI算力服务器(GPU集群)运维经验者优先
2.精通Linux操作系统及核心网络协议(TCP/IP、DNS、负载均衡)
3.熟悉GPU/TPU硬件架构及驱动配置,熟悉容器技术(Docker/K8s)在AI场景下的应用,掌握自动化运维工具(如Ansible/Terraform/Prometheus等)的使用
4.优秀的问题分析与解决能力,能快速定位并修复系统故障,熟悉应急预案制定,能够高效响应并处理突发运维事件
5.良好的团队协作精神,能适应轮班制及紧急情况下的加班需求
岗位为集团下属分子公司数创物联岗位,介意勿投。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请