职位描述:
1. 使用 AG/TTS方向的相关语音模型 进行音色训练,保证语音合成的效果,保证模型按时上线。
2. 对TTS模型的输出进行 基础调参和优化(如调整语速、音调、停顿等),提升合成效果。
3. 处理语音数据(如文本清洗、音频裁剪等),准备符合模型输入的标准化数据。
4. 测试不同TTS模型的效果,记录问题并反馈给相关专家/算法。
5. 编写简单的脚本(Python/Bash)实现批量语音合成或数据处理。
6. 根据日清数据进行热修复。
职位要求:
1、本科及以上学历,有过1年以上相关工作或项目经验优先;(经验优秀可放宽)。
2、计算机、电子信息、语音处理相关专业优先;
3、能使用Python进行 基础数据处理(如文本清洗、音频裁剪),会调用API或本地模型。
4、了解 TTS(文本转语音)基础概念,熟悉常见语音合成工具或API
5、对语音质量有基本判断能力(如是否流畅、发音是否准确)。
6、具备良好的学习能力和责任心,能按流程完成重复性任务。
中关村E世界