职位描述
岗位职责:
1、负责大模型预训练、微调、强化学习及性能优化,根据数据迭代持续优化训练大模型,提升大模型逻辑分析能力;
2、完成大模型推理服务部署吞度性能优化,协助其他团队部署大模型推理服务;
3、跟踪并分析业内最新研究成果和技术动态,持续优化和改进现有大模型生成方案,同步推理评测大模型能力提升效果,完成大模型在垂直领域的能力提升;
4、负责大模型软件栈数据工具方案设计与功能开发,落地行业客户场景;
5、根据外部团队需求,开展技术交流与沟通,设计定制化大模型构建方案,编写大模型相关技术文档及发明专利。
任职资格:
1、博士学历,熟悉大语言模型、多模态模型结构和基础算法,精通python编程,熟悉pytorch深度学习框架;
2、具备服务器使用、容器化部署、Linux基础操作、并行计算等基础知识,了解并行计算、cuda、多进程、多线程编程技术;
3、掌握大模型分布式并行策略、张量并行、流水并行、专家并行算法;
4、熟练使用大模型推理服务框架vllm、sglang等,具备对框架优化的能力,熟悉c++、cutlass、trition,具备算子性能优化的能力。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕