职位描述
【职位描述】
1. 负责语音类数据标注与处理(聚焦 TTS 及模型效果相关方向),包括但不限于:
1. 转写音频内容为文本(中文、方言或外语),辅助 TTS 训练数据构建
2. 标注 TTS 生成音频的情绪匹配度、自然度、音色一致性等核心标签
3. 参与 DPO 训练模式下的 TTS 情绪生成数据构建
4. 负责 TTS 模型生成效果的评测(如情绪还原度、语音流畅度等),输出评测报告
2. 严格按照项目的规则规范完成工作任务,确保数据准确性、一致性
3. 配合团队优化数据标检的全流程,根据个人体感提出改进建议以提升标检效率
4. 参与模型的质量校验,抽检标注数据的质量,识别标注错误、偏差,记录常见问题并输出质检结果从而推动修正标注误差
5. 整理输出/迭代相关标注文档,协同提升项目数据质量,保质保量的完成业务交付
【岗位要求】
1. 本科及以上学历(传媒、播音、影视等声学类or声音敏感相关专业优先)
2. 具备 1 年及以上 AI 语音数据标注经验,且有 TTS 模型数据标注、效果评测或 DPO 训练相关项目经验者优先
3. 中文普通话标准,听辨能力突出(熟悉方言 / 外语者优先)
4. 可以熟练使用 Office 办公软件,能在指导下完成部分报告的撰写与文档整理
5. 熟悉语音数据标注流程与质量管控逻辑,能快速适配项目标注规范,独立承担 TTS/RL 类标注任务
6. 耐心细致,能高效处理重复性数据;责任心强,注重数据安全和保密;有良好的沟通能力和团队协作意识
【加分项】
- 对语音技术(如ASR、TTS、NLP)有基本了解
- 有AI数据标注、语音类数据项目经验
- 对大模型行业有较好的认知和理解,深度体验或使用过Kimi、文心一言、豆包、chat gpt等大模型产品者优先
- 掌握多语言加分(英语/日语/粤语等)
三、福利待遇
1. 具有竞争力的薪资待遇,根据个人在项目中的能力和表现提供薪资增长空间
2. 完善的福利体系,包括五险一金、带薪年假、节日福利等
3. 良好的工作环境和团队氛围,提供语音大模型领域的学习和成长机会,支持员工在语音数据技术方向的职业发展
4. 参与ai行业前沿项目的机会,与业内优秀的语音技术专家、数据科学家合作,共同推动 TTS 技术的发展
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕