3-3.5万·16薪
春晖路
岗位优势:
薪资可谈,晋升空间大,各项福利待遇好,公司氛围好,有发展前景
岗位职责
1. 负责AI基础架构(如GPU/算力集群、分布式存储、高速网络)的规划、部署、监控与维护,保障高可用性;
2. 优化AI训练/推理集群的资源调度与负载均衡(如Slurm/Kubernetes/Kubeflow),提升算力利用率与任务效率;
3. 设计自动化运维方案,支持大规模分布式训练、模型版本管理及多环境协同(开发/测试/生产);
4. 解决AI系统底层性能瓶颈(如网络延迟、存储I/O、GPU显存优化),协同硬件团队完成调优;
5. 制定AI基础架构的灾备、扩容及安全策略,确保数据合规与系统韧性;
6. 跟踪AI基础设施技术(如高性能计算、RDMA网络、MLOps工具链),推动技术迭代与标准化。
任职要求
1、 一本及以上学历,计算机、电子信息、人工智能等相关专业;具有AI 架构师经验
2、 有算力调配,及运维经验
3、 熟悉Linux系统及脚本开发(Python/Shell),精通容器化与编排技术(Docker/K8s);
4、 熟悉AI算力集群管理(GPU/NPU资源分配、监控与故障排查);
5、 掌握分布式系统原理,了解AI训练框架(PyTorch/TensorFlow)的底层架构与依赖;
6、 熟练使用监控工具(如Prometheus),具备自动化脚本开发能力;
7、 有大规模AI集群运维经验或参与过AI平台搭建 ;
8、 逻辑清晰,表达能力强,具备良好的团队协作意识。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕