职位详情
【26届校招】-GPU平台研发算法工程师/青年研究员-系统平台中心
面议
上海人工智能实验室
上海
无经验
硕士
12-01
工作地址

国际传媒港L1栋

职位描述
工作职责:1.参与建设AI算力云原生平台,提供高性能、高稳定性、高易用性加速计算平台。
2.参与 Kubernetes 调度策略定制与批处理调度器扩展开发,支持AI训练任务的优先级管理、资源抢占、弹性伸缩,适配分布式训练的算力调度需求。
3.优化GPU资源全生命周期管理,包括分配、隔离、监控、容错等,结合业务特征设计智能调度策略,平衡算力供给与成本控制。
4.参与大规模 AI 训练任务故障诊断与自愈体系的设计与实现,基于硬件、通信指标监控和事件分析,设计智能告警与根因定位系统,快速识别任务异常并进行故障隔离。
5.在导师指导下探索业界最新技术方向,参与开源社区实践,提升团队云原生 AI 核心竞争力。

岗位要求:
1. 计算机/人工智能/软件工程等相关专业; 2. 熟悉后端服务开发,熟悉Golang和Python编程语言,有良好的编程规范意识,能独立完成服务接口与交互逻辑开发; 3. 掌握kubernetes基本工作原理,熟悉Volcano、Kubeflow、Argo等相关AI云原生框架者优先;有相关课程设计、项目实践经验者可优先考虑; 4. 有基本的数据检索和分析能力,掌握SQL语法,熟悉时间序列数据库及其查询语言(如PromQL)优先; 5. 对后端开发和分布式系统领域有浓厚兴趣,关注行业技术动态,有持续学习和提升技术能力的意愿; 6. 具有较强的学习能力和问题解决能力,能够快速掌握新技术,独立分析和解决模块开发过程中遇到的问题;

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请