一、职位描述
 1.负责大模型训练数据的构建,包括高质量数据生产、整理和清洗工作; 
2.负责模型效果测评,对数据正确性提供判断,对模型生成内容正确性提供判断,对模型进行内容改进策略建议; 
3.对大模型应用案例和数据进行分析,归纳关键性和普遍性问题,提高内容优质率; 
4.推动大模型应用方向数据标注工作,指导标注人员完成数据的高质量构建,保证按目标及质量要求完成结果产出; 
5.对大模型的prompt撰写有了解,并且能够根据应用场景,进行prompt调优,驱动模型达到最优效果。
 
 二、职位要求
 1.35岁以下,本科及以上学历,计算机科学、数据科学或相关专业,3年以上相关工作经历;
 2.计算机科学、数据科学或相关领域的本科及以上学历。 
3.熟练掌握至少一种编程语言,如Python,具备良好的编程实践。 
4.有NLP自然语言处理经验者优先;了解大模型数据要求、大模型训练过程。 
5.熟悉Data-Juicer等大模型数据治理开源框架。 
6.了解机器学习和数据科学原理,有实际项目经验。 
7.良好的沟通能力和团队合作精神,能够与跨部门团队紧密协作,推动项目进展。 
8.具有快速学习和适应新技术的能力,能在动态环境中不断优化模型和算法。