职位描述
1. 语音模型研发优化:深耕语音识别(ASR)、语音合成(TTS)、音频理解(含声音事件检测、情感分析等)核心技术,精通底层模型原理,负责模型的设计、训练、调优及效果迭代,持续提升语音交互的准确率、自然度与鲁棒性。
2. 深度学习工程落地:基于PyTorch/TensorFlow等框架搭建高效的语音算法训练与推理链路,解决梯度消失、过拟合等核心技术问题,推动算法从原型验证向生产级引擎高效转化。
3. 多语言引擎开发:运用C/C++、Python、Java(或Golang等)编程语言,完成语音算法引擎的模块化开发、封装与集成,保障引擎在高并发、低延迟场景下稳定运行,配合业务端完成适配调试与问题排查。
4. 异构计算与芯片适配:基于CUDA开展GPU加速开发以优化推理性能,参与语音算法在国产芯片的适配、移植与性能调优工作,充分释放硬件算力潜能。
5. 技术沉淀与创新:持续跟踪领域前沿技术动态,结合业务实际需求开展预研与技术创新,沉淀研发经验及工程化方案并形成规范文档,助力团队整体技术能力提升。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕