职位职责
1)从事大模型训练的相关研发工作;
2)参与建设模型训练流程所需工具,包括但不限于数据处理、训练算法优化和调整模型结构等;
3)参与大模型微调、训练应用场景识别,完成大模型微调、训练任务落地,侧重于规划、工具调用等Agent能力训练方面;
4)开展大模型前沿技术及应用的研究和引入。
任职要求
1)硕士研究生及以上学历,计算机科学、数学或统计学等相关专业;
2)具备三年以上机器学习相关经验,具备强化学习、多模态大模型训练经验、Agent训练经验者优先;
3)熟悉python编程语言,熟悉常见的机器学习或者深度学习中的一个或多个(Pytorch等);
4)熟练使用模型微调、训练相关框架(deepspeed,ms-swift,mindspore等),能够独立完成模型的微调、训练;
5)具备良好的沟通能力、写作能力和团队合作精神。