「北京朝阳区高级语音合成算法工程师招聘」

职位详情

高级语音合成算法工程师

3.5-6.5万·16薪

南方新华

北京

3-5年

本科

01-16

工作地址

利泽西街东湖国际

职位描述

1、负责语音合成及音频生成算法的研发与优化，应用于直播、短视频、外呼、音乐内容创作等创新场景。
2、负责多语种、多风格语音合成模型的训练与效果调优，探索解决跨领域数据融合与模型适配问题。
3、跟进并实现语音/音频生成领域的前沿技术（如Codec-LLM架构、流匹配、扩散模型等），提升合成音质的自然度与表现力。
4、优化从数据处理、模型训练到推理部署的全链路效率与稳定性。
任职要求：
1、计算机、人工智能、信号处理等相关专业，统招本科及以上学历。
2、深入理解现代语音合成/音频生成技术，熟悉声学模型、声码器（如EnCodec, SoundStream）、神经编解码器等核心组件，有实际调优经验。
3、熟练掌握基于LLM或扩散模型的生成架构（如VITS, FastSpeech系列, VoiceBox, CosyVoice等），并具有相关模型的训练、调优或改进经验。
4、精通Python，熟练掌握PyTorch或TensorFlow深度学习框架，具备优秀的工程实现与算法优化能力。
加分项：
1、在音乐生成、歌声合成、音色转换等相关领域有研究或项目经验。
2、有大规模音频数据处理、模型推理加速或高性能计算经验。

以担保或任何理由索取财物，扣押证照，均涉嫌违法，请提高警惕