职位详情
语音感知交互工程师
2-2.5万
鼎桥技术有限公司
成都
3-5年
本科
01-10
工作地址

AI创新中心

职位描述
岗位职责:
1.核心算法研发与迭代
负责机器人语音交互关键技术的研究与开发,包括语音识别(ASR)、语音分离与增强、语音合成(TTS)、关键词唤醒(KWS)、声纹识别、声源定位、异常声音识别等方向。
持续优化算法在复杂场景下的识别率、实时性、鲁棒性与资源占用,提升用户体验。
跟进语音领域前沿技术,推动适合产品需求的创新算法落地。
2.算法工程化与系统部署
主导语音算法从原型到产品级的工程实现,完成模型轻量化、推理加速与多平台(如嵌入式、移动端、CPU/GPU)适配。
设计高可用的语音处理Pipeline,支持低延迟、高并发的实时交互场景。
与软件、硬件团队协同完成算法集成、联调与性能优化,确保系统稳定交付。
3.数据体系建设与效能提升
构建高效的数据闭环系统,覆盖数据采集、标注、清洗、增强与管理流程,提升数据驱动的算法迭代效率。
针对业务场景进行数据分析与挖掘,定向优化模型泛化能力和场景适应性。
4.技术沉淀与创新
撰写算法设计文档、实验报告与技术总结,推动团队知识共享。
结合研发成果,进行核心技术专利的规划与申请。

任职要求:
基本要求:
1.本科及以上学历,计算机、人工智能、电子信息、数字信号处理、应用数学等相关专业,3年以上语音算法研发与落地经验。
2.扎实的语音信号处理和机器学习基础,熟悉至少一个主流深度学习框架(如PyTorch、TensorFlow)。
3.在以下至少一个方向有实际项目经验:语音识别(ASR)、语音合成(TTS)、语音分离/增强、关键词唤醒(KWS)等。
4.具备较强的算法工程化能力,熟悉模型优化、压缩、加速及端侧部署(如TensorRT、ONNX、端侧推理框架等)。
5.熟练掌握Python/C++,具备良好的代码工程能力和系统调试能力。
6.具备良好的沟通协作能力和文档习惯,能推动算法在复杂系统中落地。

加分项:
1.具备嵌入式/移动端语音算法部署和性能调优经验,熟悉ARM/NEON指令优化。
2.有大规模语音数据处理经验,熟悉数据闭环构建与数据策略设计。
3.在语音相关顶会(如INTERSPEECH、ICASSP等)发表过论文,或有开源项目贡献。
4.了解多模态交互、自然语言处理(NLP)相关技术,具备跨领域整合经验。
5.有机器人、智能硬件、车载语音等实际产品语音系统开发经验者优先。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请