职位描述
位描述
1、研究多模态数据(如音频、视频、自然语言、用户交互)的分析、处理和生成算法,实现多种模态间的融合、转化和交互;
2、探索新颖的多模态交互与生成的应用场景,推进多模态信息处理在不同业务场景下的落地。
任职要求
1、硕士及以上学历,计算机科学/电子/数学/统计专业;
2、扎实的编程能力,拥有相应的音频、视频、自然语言处理的背景知识;
3、对至少一个深度学习工具有过深入了解,如PyTorch、TensorFlow等;
4、具有解决富有挑战的新颖问题的能力和热情。
加分项:
1、在顶级会议或期刊上发表过文章,包括但不限于:ISMIR、Interspeech、ICASSP、ACL、EMNLP、CVPR、ICCV、ICLR、ICML、NeurIPS、IEEE;
2、在多模态融合方面有实际算法落地经验;
3、有良好的团队协作和独立工作的能力。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕