职位描述
面向AI应用场景的大模型微调,优化PostTraining
(SFT/RM/RL) 算法的训练效率和实际用户体验效果;
2.研究各领域高质量数据的自动化合成方法,建设高效的线上数据飞轮链路;
3.配合产品和工程,探索LLM在创作、教育、金融、代码等场景下的创新应用。
二、岗位要求
1.本科及以上学历,计算机、人工智能、数学等相关专业(有数学、编程竞赛加分);
2.多年NLP/深度学习研发经验,至少1年大模型应用相关实战经验;
3.深入理解LLM技术栈(如SFT、RM、RLHF、数据合成等);
4.熟悉Python/PyTorch,以及Transformer、MoE等核心网络架构;具备扎实的代码能力(Python);
5.熟练掌握peft、llama factory等微调、训练工具;
6.在ACL/EMNLP/NeurIPS等顶会发表LLM相关论文者加分
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕