岗位一
1、负责大模型训练数据的评测,包括但不限于文本、图像、多模态数据等;
2、根据标注规范对数据进行精准标注,确保数据质量符合模型训练要求;
3、对标注数据进行质量检查,识别并修正错误,将其改写成优质数据;
4、参与标注规则的制定与优化,持续提升标注效率和一致性;
5、作为指导员带教外部众包标注。
职位要求
1、专科及以上学历,语言学、文学、哲学、历史学、新闻学等专业优先;
2、有至少1年及以上大模型评测、或搜索内容评测经验,对数据敏感(有SFT阶段数据标注经验优先);
3、自我管理意识强,态度端正,细心负责;
4、学习能力强,有较强的执行能力和责任感,能接受繁琐重复的工作
岗位二
1、本科及以上,语言学、心理学、新闻传播、播音主持、语文教育等文科专业,英语通过CET-4/CET-6优先;
2、1年及以上大模型问答类文本改写经验,对文字保持敏感度,准确识别优质对话内容;同时兼具良好的写作能力,拥有文本编辑/改写/评测经验,能够对瑕疵内容进行有效优化;
3、参加过PromptEngineering或半自动标注生产的项目,掌握PE能力;
4、高度总结归类同类型内容,对抽象概念作出灵活、通俗化阐释;有较强的学习能力、逻辑能力强、细心,能够处理复杂的对话场景;
5、对汉语言相关知识有一定了解,了解汉语拼音、韵律等语言知识并能在工作中进行相应的应用;有对话数据采集和语言文本类大模型项目经验者优先。
1、负责大模型相关语料和数据的撰写与评估等工作,支持项目经理和产研团队定义数据评测和标注环节的理想态;
2、承接业务与项目经理要求,结合PE工程、平台工具等方式提升数据交付的质量和效率,并沉淀方法文档;
3、深刻理解数据交付的需求,负责数据质量把控,梳理并分析数据质量的问题,并对市场上相关数据进行行业调研并输出分析报告;
4、运用基本的数据分析方法和工具,对训练数据进行统计和分析,提供有效的数据结论、数据支持和优化建议。
岗位三
1、本科及以上学历、语音学、汉语言相关专业、计算语言学、英语好;
2、参加过PromptEngineering或半自动标注生产的项目,掌握PE能力优先;3、有1年以上大语音模型任务评测或标注的经验,有语义学、语用学、语音或者音系研究经验者优先;
3、有TTS正则化、拼音标注、AI播客等任意经验,TTS优质产品经验优先,了解语音算法及模型训练原理优先;
1、按项目标准完成语音/文本数据标注、评测,通过全流程操作保障数据高效产出与质量达标;
2、自然对话音频剪辑转写文本校对、拼音标注、模型评测、发音效果评测(语音准确性、停顿、拟人、情感等)、产品巡检问题反馈、具有一定音色审美能力
3、及时沟通工作异常案例并跟进解决,主动发现流程痛点。
4、负责大模型相关语料和数据的撰写与评估等工作,支持项目经理和产研团队定义数据评测和标注环节的理想态;
5、承接业务与项目经理要求,结合PE工程、平台工具等方式提升数据交付的质量和效率,并沉淀方法文档;
6、深刻理解数据交付的需求,负责数据质量把控,梳理并分析数据质量的问题,并对市场上相关数据进行行业调研并输出分析报告;
7、运用基本的数据分析方法和工具,对训练数据进行统计和分析,提供有效的数据结论、数据支持和优化建议。