工作内容:
1、负责语音数据的标注工作,确保标注质量符合项目要求;
2、负责ASR语音数据的特征标注及TTS语音数据的端到端标注;
3、按照ASR/TTS双标注规范执行,精准捕捉语音信号中的声学特征与语言特征;
4、针对不同语音模型(ASR/TTS)特性设计标注方案,提升数据对模型训练的针对性;
5、完成TTS端到端标注全流程:从文本预处理标注(分词/标点/情感标记)到语音合成质量评估(语音-文本一致性、韵律合理性);
6、建立语音合成质量评价体系,支持算法测评任务。
薪资待遇:8-15K,具体面聊
工作时间:9:30-18:30,中间休息1小时,周末双休
岗位要求:
1、熟悉ASR/TTS标注的规范与流程,能够准确理解和处理各类语音数据的特性,至少拥有1年以上的语音ASR/TTS标注或评测相关经验,具备敏锐的语音数据感知能力和精准的判别能力;
2、 具备较强的逻辑思维和分析能力,能够协助项目负责人进行数据分析与总结,提供有价值的优化建议以支持项目推进;
3、拥有高质量的语音标注能力,能够确保输出数据的准确性与一致性;
4、对大模型训练所需的语音数据需求有一定了解,能够根据模型特性优化标注策略者优先考虑;具备英语、小语种或汉语言专业背景,且具备剪辑能力者优先。