职位描述:
我们正在寻找一位对音视频处理、语音识别、语音合成、大模型文本翻译及口唇同步等技术充满热情的算法实习生。加入我们的团队,你将有机会参与前沿AI技术的研发与落地,探索多模态交互的未来。
工作职责:
1. 参与音视频信号处理算法的研究与优化,包括但不限于语音增强、降噪、回声消除等。
2. 探索语音识别(ASR)和语音合成(TTS)技术,优化模型性能与实时性。
3. 研究大语言模型(LLM)在文本翻译、语音生成等任务中的应用与优化。
4. 开发口唇同步(Lip Sync)技术,提升虚拟人的自然交互体验。
5. 协助团队进行算法部署与性能调优,推动技术在实际场景中的应用。
任职要求:
1. 学历背景:计算机科学、人工智能、电子工程、信号处理等相关专业的硕士或博士在读生。
2.技术能力:
- 熟悉Python/C++,具备扎实的编程和算法基础。
- 熟悉深度学习框架(如PyTorch、TensorFlow),有语音/视频相关项目经验者优先。
- 了解语音识别(如Whisper)、语音合成(如VITS)、大模型(如GPT、LLaMA)或口唇同步(如Wav2Lip)等技术。
- 有音视频编解码(FFmpeg)、信号处理或多媒体开发经验者加分。
3. 学习能力:对AI技术有强烈兴趣,具备快速学习新技术的能力。
4. 团队协作:良好的沟通能力,能与团队高效配合。
加分项:
- 在顶级会议(ICASSP、Interspeech、CVPR等)发表过相关论文。
- 有开源项目贡献或相关竞赛(如Kaggle)获奖经历。
实习收获:
- 深入参与AI前沿技术的研发,积累实战经验。
- 与行业顶尖团队共事,获得专业指导。
- 表现优异者有机会获得转正机会。
工作地点 & 时间:
- 地点:可远程或线下(具体根据公司政策)
- 时长:3个月及以上,每周至少4天
---
如何申请:
请将简历、项目/论文链接发送至:[邮箱地址],邮件标题注明“算法实习生申请-姓名-学校”。