工作职责:
1.负责智能座舱场景下的多模态(舱内外语音、舱内外视觉、车身状态参数等模态)大模型的指令微调、偏好对齐等阶段的工作,包括但不限于数据迭代、模型训练、模型自动化评测等环节。
2.搭建训练数据处理Pipeline,推动汽车座舱场景的音视频、文本等数据闭环,结合模型反馈进行数据动态筛选与更新,包含但不限于数据的质量评估、清洗、格式化、分类等。调优训练数据配比,持续构建与优化数据集。
3.基于多模态大模型,适配智能座舱场景中各类下游应用(乘客复杂意图理解,情绪健康关怀,GUI Agent等),探索大模型以及相关人工智能技术在车载场景的落地方案。
4.密切追踪国际多模态大模型领域的最新研究成果与发展趋势,积极引入先进理念和技术,保持技术的领先性。
任职要求:
1.计算机、人工智能等相关专业硕士及以上学历,具备丰富的多模态理解、计算机视觉、语音识别或强化学习算法经验,对多模态大模型算法有深入理解。
2.熟练应用pytorch、deepspeed、megatron、lamma factory、transformers等深度学习框架和库。
3.熟悉多模态大模型领域的重要算法和模型(如Qwen2.5-VL、GLM-4V等),掌握大模型各类高效微调方法;
4.有数据清洗、采样、去重、主动学习、视频内容检测等方面的实战经验,对大模型数据闭环及主动学习有一定了解;
5.对 AI 前沿技术保持热情,具备快速学习与创新意识,能够主动探索业务需求与技术创新的结合点;
加分项:
1.具备扎实的编码能力,具有优秀的基础算法、代码能力,熟练掌握C/C++或Python编程语言,ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先;
2.在具有扎实的计算机视觉、机器学习基础,熟悉CV、AIGC、NLP、RL等技术领域,在CVPR、ECCV、ICCV、NeurIPS、ACL、NACCL等顶级会议上发表论文者优先
3.在大模型相关岗位有工作经验,且涉及智能座舱、车载交互等领域者优先。