职位描述
1、负责语音合成(TTS)核心算法研发与工程落地,聚焦直播、短视频、外呼等场景,优化语音自然度、韵律贴合度及低延迟性能,支撑业务规模化应用。
2、主导多语种语音合成模型训练与调优,深入研究各语种本地化语言特点(韵律、发音规则),适配不同地区用户需求,迭代声学模型与声码器效果。
3、深耕 TTS 前沿技术探索,重点围绕声码器(Codec)优化、VITS/FastSpeech 等模型改进、多模态联动(文字 / 情感→语音)、模型推理加速等方向突破,提升音质与效率。
4、协同工程、产品团队,解决 TTS 在实际业务中的落地问题(如直播实时合成、短视频语音配音适配),输出可复用的算法方案与技术组件。
任职要求
1、计算机、电子信息、自动化、声学相关专业,统招本科及以上学位,有 1 年及以上语音合成(TTS)核心算法研发 / 调优经验者优先(含优质实习经验)。
2、精通 TTS 核心原理,熟悉主流算法(VITS、FastSpeech、FastSpeech2、CosyVoice 等),具备声码器(Codec)优化、声学模型训练调优经验,有多语种 TTS / 音乐生成 / 声音转换(VC)经验者加分。
3、掌握 Python/Shell,熟练使用 PyTorch/TensorFlow 任一框架,有模型推理加速、代码工程化优化经验(如提速、显存优化)者优先。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕