职位详情
大模型算法工程师(拔尖计划)
面议
中移金科
北京
5-10年
硕士
06-05
工作地址

博瑞琪大厦

职位描述
岗位职责:
1、大模型优化算法的研究与设计:负责研究大模型领域(语言模型、多模态模型等)的优化算法、网络结构优化及改进设计、大模型蒸馏训练,以及预训练研发任务等;
2、垂类领域大模型研发与调优:负责针对专业领域场景和数据,利用增量训练、微调训练、知识增强、超参数调整等技术训练垂类领域大模型,提升模型性能,并维护线上模型的稳定性,实现AI项目落地与交付;
3、大模型国产化性能优化与适配:适配昇腾等国产硬件平台,优化模型算子性能及分布式训练策;
4、技术探索与创新:跟踪大预言模型、多模态大模型的预训练、大模型方向的最新成果,探索其在业务中的应用价值。
任职资格:
1、硕士研究生及以上学历,计算机及相关专业;
2、具备五年以上相关工作经验。参与过大模型相关开发工作,包括但不限于:数据清洗、开源模型实际微调、训练框架开发、评测、推理部署等;
3、精通Python编程语言,熟悉Java等其他编程语言,熟悉常用框架如PyTorch,TensorFlow等深度学习框架;
4、熟悉大语言模型的增量预训练、指令微调、偏好微调等多种训练方法,有全场景训练实战落地经验;
5、熟悉全参数、LoRA、QLoRA等微调方法,有微调场景落地经验;
6、熟悉DeepSpeed、flash-attn、vllm等大模型训练及推理加速方法;
7、熟悉数据收集、清洗和预处理的流程。有训练数据构造落地经验。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请