1、按项目标准完成语音/文本数据标注、评测,通过全流程操作保障数据高效产出与质量达标;
2、自然对话音频剪辑转写文本校对、拼音标注、模型评测、发音效果评测(语音准确性、停顿、拟人、情感等)、产品巡检问题反馈、具有一定音色审美能力
3、及时沟通工作异常案例并跟进解决,主动发现流程痛点。
4、负责大模型相关语料和数据的撰写与评估等工作,支持项目经理和产研团队定义数据评测和标注环节的理想态;
5、承接业务与项目经理要求,结合PE工程、平台工具等方式提升数据交付的质量和效率,并沉淀方法文档;
6、深刻理解数据交付的需求,负责数据质量把控,梳理并分析数据质量的问题,并对市场上相关数据进行行业调研并输出分析报告;
7、运用基本的数据分析方法和工具,对训练数据进行统计和分析,提供有效的数据结论、数据支持和优化建议。
1、统科及以上学历、语音学、汉语言相关专业、计算语言学、英语好;
2、参加过PromptEngineering或半自动标注生产的项目,掌握PE能力优先;3、有1年以上大语音模型任务评测或标注的经验,有语义学、语用学、语音或者音系研究经验者优先;
3、有TTS正则化、拼音标注、AI播客等任意经验,TTS优质产品经验优先,了解语音算法及模型训练原理优先;
4、逻辑思维强,学习理解能力强,善于发现问题并反馈,对语音数据有敏锐感知和判别能力;
5、了解韩语基本拼音声韵、因素、韵律等语言知识,并能在工作中进行相应的运用;
6、抗压力好,灵活性高,能快速数量掌握各类标准判别标准,善于总结工作经验,具有团队意识。