职位详情
大模型技术专家
1.8-3.5万
航天科工(北京)空间信息应用股份有限公司
北京
1-3年
硕士
02-27
工作地址

北京丰台总部基地12区

职位描述
岗位职责
1、核心职责:研究确定大模型产品和项目技术路线;编制大模型项目技术方案;
2、负责大模型核心技术研发工作,包括模型训练、模型微调、模型推理、模型评测、模型安全、模型轻量化等围绕大模型全链条的工具集和服务研发;
3、负责大模型训练、推理等计算过程对国产或异构算力资源的适配;
4、负责实现大模型分布式并行训练,并对硬件算力资源进行统一调度;
5、负责对垂直领域行业大模型训练提供支撑保障。
任职资格
1.计算机科学或人工智能等相关专业,硕士及以上学历;
2.有深度学习领域知识背景,了解基本的深度学习原理,熟悉常用的深度学习框架,如TensorFlow、PyTorch等;
3.熟悉Linux开发环境,具有良好的编程能力,熟悉计算机相关基础知识,至少掌握以下一种编程语言:python/go/java;
4.熟悉大模型训练、微调等环节的原理和方法;
5.了解大规模分布式训练基本方法,了解混合精度训练、数据并行等训练加速方法;
6.了解高性能计算、GPU计算、GPU-CPU混合计算、云计算等;
7.有激情,责任心强,具有分析问题和解决问题的能力,具备良好的团队合作精神和沟通能力。
加分项:
1.有深度学习框架的研究或开发经验者优先;
2.有大规模AI训练和推理经验者优先;
3.有大模型管理平台开发经验者优先;
4.熟悉DeepSpeed、Colossal-AI 等分布式并行训练框架者优先;
5.985/211院校计算机/自动化/人工智能/遥感/地信等相关专业硕士/博士优先。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请