职位详情
高级语音合成算法工程师
3.5-6.5万·16薪
南方新华
北京
3-5年
本科
01-16
工作地址

利泽西街东湖国际

职位描述
1、负责语音合成及音频生成算法的研发与优化,应用于直播、短视频、外呼、音乐内容创作等创新场景。
2、负责多语种、多风格语音合成模型的训练与效果调优,探索解决跨领域数据融合与模型适配问题。
3、跟进并实现语音/音频生成领域的前沿技术(如Codec-LLM架构、流匹配、扩散模型等),提升合成音质的自然度与表现力。
4、优化从数据处理、模型训练到推理部署的全链路效率与稳定性。
任职要求:
1、计算机、人工智能、信号处理等相关专业,统招本科及以上学历。
2、深入理解现代语音合成/音频生成技术,熟悉声学模型、声码器(如EnCodec, SoundStream)、神经编解码器等核心组件,有实际调优经验。
3、熟练掌握基于LLM或扩散模型的生成架构(如VITS, FastSpeech系列, VoiceBox, CosyVoice等),并具有相关模型的训练、调优或改进经验。
4、精通Python,熟练掌握PyTorch或TensorFlow深度学习框架,具备优秀的工程实现与算法优化能力。
加分项:
1、在音乐生成、歌声合成、音色转换等相关领域有研究或项目经验。
2、有大规模音频数据处理、模型推理加速或高性能计算经验。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请