1.模型研发:研究、设计并实现前沿的VLM/VLA模型架构,使其适用于自动驾驶的感知、预测、规划等任务(如场景描述、危险识别、因果推理、行为解释、端到端规划等);
2.数据处理及挖掘:构建和管理大规模、高质量的多模态(视觉、文本、驾驶动作)数据集,设计高效的数据标注、清洗和增强 pipeline;
3.算法训练与优化:利用提示工程、模型微调、多模态对齐、强化学习等技术进行模型训练,优化训练效率与稳定性;
4.评估与测试:构建测试评估数据集,测评模型在安全、合规、舒适等多维度下的性能,持续迭代优化模型。
任职要求:
1.计算机科学、人工智能、机器人或相关领域的硕士/博士学历;
2.对机器学习、深度学习有深入的理解,熟悉大模型常用模型设计及训练方法,在以下一个或多个领域有扎实的理论基础和实践经验:
视觉-语言模型(VLM):如图文理解,图文检索,图文生成等
视觉-语言-行动模型(VLA):如端到端驾驶、机器人操控、具身智能等
自动驾驶AI算法:如感知、行为预测、运动规划等
在国际顶级机器学习、机器人相关会议、期刊发表过论文者优先,在机器学习相关竞赛中取得优异成绩者优先。
3.具备出色的分析问题和解决问题的能力,良好的沟