职位描述
工作内容:
1.负责多模态大模型的研发,主要是图像、文本、语音、视频等数据对齐、训练、优化;
2.负责文生图、文生视频、数字人研发;
3.负责RAG优化、多智能体研发。
技能要求:
1.能够处理不同模态数据(如图像、文本、语音、视频等)的能力,理解如何从不同类型的数据中提取信息并进行有效融合;
2.掌握多模态对齐技术(如图像-文本对齐、语音-文本对齐等)以及跨模态信息融合的算法,提升不同模态数据间的协同工作能力;
3.熟练掌握图像处理和计算机视觉技术,如图像分类、目标检测、语义分割、图像生成等;
4.根据业务场景研发智能体流。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕