负责开发语音识别、自然语言处理和语音合成等技术,实现人机交互和语音交互功能,提高用户体验和机器的智能化水平。
职责描述:
1.负责机器人语音交互系统开发,包括声纹识别、情绪识别、意图理解、交互逻辑等算法研发与优化;
2.设计并优化语音识别(ASR)、语音合成(TTS)算法,提升交互效率和准确性;
3.参与系统架构设计,推动语音交互系统的性能改进;
4.负责语音数据采集、处理、压缩、存储等,确保数据质量和安全;
5.跟踪前沿技术,探索语音交互的创新应用。
任职要求:
1.本科及以上学历,计算机、通信、电子等相关专业,扎实的数学基础和算法能力,熟练掌握信号处理、语音识别、语音合成、自然语言处理等相关技术;
2.精通C++、Python,熟悉Kaldi、WeNet等语音工具库及TensorFlow、PyTorch等常用深度学习框架;
3.掌握音频编解码(PCM/MP3/AAC)及音频采集、处理和压缩等相关技术;
4.具备语音识别/合成、NLP(文本处理、语言模型)等项目经验;
5.具备良好的逻辑思维能力、解决问题能力以及强烈的技术好奇心。