职位描述
岗位职责:
1.独立负责机器人前端音频处理核心模块研发,包括麦克风阵列波束成形、360° 声源定位、运动噪声抑制等,解决机器人移动、作业场景下的语音信号处理难题。
2.主导机器人端 ASR/TTS 算法的设计、训练与优化,针对机器人动作指令(行走、抓取、交互等)进行领域适配;完成模型量化、剪枝、蒸馏等轻量化工作,满足端侧低延迟(≤200ms)、低功耗的部署要求。
3.负责语音 - 动作交互协同算法开发,设计意图识别、多轮对话管理、语音指令到关节动作的映射机制,实现全链路闭环交互;参与多模态融合(语音 + 视觉 + 运动控制)算法设计,提升复杂场景交互准确性。
4.完成算法在机器人端侧硬件(ARM/NPU/DSP,如 Jetson AGX Orin、RK3588)的部署与优化,适配 ROS/ROS2 框架,与运动控制、硬件团队协作定义接口规范,保障模块高效联动。
5.搭建机器人语音交互评测体系,设计实机测试方案,通过 A/B 测试持续迭代算法;跟踪行业前沿技术,推动算法在产品中的落地与优化。
任职要求:
1.本科及以上学历,计算机、电子信息、通信工程、自动化、声学、机器人学等相关专业,3 年以上语音交互算法研发经验。
2.扎实掌握信号处理、深度学习理论,精通 ASR/TTS/ 语音增强至少一个核心模块的算法原理与工程实现,熟悉 Conformer、Transformer 等主流模型。
3.熟练使用 Python/C++ 编程语言,精通 PyTorch/TensorFlow 框架;掌握 Kaldi、WeNet、Whisper 等至少一种语音开源工具链,具备丰富的算法工程化经验。
4.具备端侧模型量化、剪枝、推理加速经验,有机器人(人形 / 服务机器人)语音交互项目落地经验者优先。
5.熟悉 ROS/ROS2 机器人开发框架,了解机器人端侧硬件部署环境;具备良好的跨团队协作能力,能独立解决复杂技术问题。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕