岗位职责:
1、负责领域大模型的微调、优化,提升模型在具体任务上的性能和泛化能力。
2、参与训练的数据构建及质量评估方案设计,确保训练数据的有效性。
3、参与模型评估指标和方案设计,分析模型表现和设计改进方法。
4、研究并应用主流的模型微调技术及强化学习方法(如PPO、DPO等)进行模型创新性改进;
5、熟悉模型infra基础知识,与相关团队紧密协作,共同推动模型训练能力提升和推理加速。
任职要求:
1、本科及以上学历,人工智能、计算机科学等相关专业;
2、扎实掌握深度学习理论基础,熟悉大模型的底层原理;
3、熟练掌握至少一种深度学习框架,具备一些模型训练与调优经验;
4、良好的编程能力和工程实现能力,熟练使用Python,有良好的代码规范;
5、熟悉常见的大模型微调技术以及强化学习相关算法;
6、熟悉数据预处理流程,包括数据清洗、标注、格式转换、语料构建等;
7、熟悉模型基础架构设计和具备相关优化经验者优先;
8、有开源项目贡献经历或大型模型训练调优实战经验者优先;