职位详情
大模型开发工程师(J48713)
2-2.5万
京东方科技集团股份有限公司
成都
无经验
硕士
04-23
工作地址

成都市郫都区合作路1188号5号

职位描述
工作职责
1. 负责大规模算力平台规划、架构设计、核心技术研发,确保高性能、高可用和可扩展性
2. 负责GPU集群、高速网络、分布式存储系统的深度集成,制定弹性扩展与容灾方案
3. 负责算力平台与主流AI框架的适配优化,推动工具链集成
4. 负责分布式训练和推理任务的性能瓶颈分析和调优
5. 负责算力平台核心组件的开发和维护

任职资格
教育程度:硕士
工作经历:
1. 硕士学历,计算机、人工智能、高性能计算或相关专业,5年以上AI平台开发经验
2. 熟练掌握大模型训练全流程,掌握分布式训练、参数服务器、通信优化等关键技术
2. 熟练使用深度学习和分布式框架,DeepSpeed、Megatron等
3. 熟练使用Kubetnetes等集群调度系统和异构加速方案,了解GPU虚拟化技术
4. 熟悉主流算力芯片特性和调优方法
5. 优秀的跨部门沟通和协作能力
6. 有大规模(千卡以上)分布式训练集群的建设和优化经验优先
所需专业:计算机、人工智能、高性能计算、电子信息类
其他要求:SpringMVC、SpringBoot/SpringCloud、Hibernate、JPA
语言要求:Java
【需长期出差】

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请