职位描述
岗位职责:
1、VLA(视觉-语言-行动)大模型在智驾场景的架构设计与核心算法研发,聚焦多模态数据(图像、文本、传感器信号)对齐与融合技术攻关;
2、端到端智驾系统开发,覆盖轨迹预测、路径规划、决策控制等核心任务,适配城市NOA、无高精地图驾驶等复杂场景;
3、VLA大模型工程化落地,包括大规模分布式训练优化、车端嵌入式平台适配及模型量化、剪枝等推理性能优化;
4、搭建多模态数据处理流水线,完成数据集清洗、标注、增强,支撑模型迭代与效果验证;
5、跟踪学术界主流VLA模型前沿技术,结合业务场景开展技术创新与落地,提升智驾系统泛化能力与安全性;
6、协同测试、工程团队完成实车调试与问题定位,保障算法满足量产指标(资深/专家岗额外需主导技术方案设计与跨团队协作)。
岗位要求:
1. 硕士及以上学历,计算机科学、人工智能、机器人学、自动化、车辆工程等相关专业,博士优先。
2. 核心技术能力
(1)精通VLA/VLM/LLM模型架构与训练逻辑,深入理解多模态数据融合、对齐技术,掌握模仿学习、强化学习等算法在智驾场景的应用逻辑;
(2)熟练运用Python,资深/专家岗需掌握C++,精通PyTorch等深度学习框架;
(3)熟悉nuScenes、Waymo等主流自动驾驶数据集,能独立搭建数据处理流程,理解智驾感知、决策、规划核心任务及复杂交通场景适配逻辑;
(4)具备传感器融合(LiDAR/Camera)、ROS系统相关经验,拥有实车调试与问题定位能力。
(5)熟悉DeepSpeed/FSDP等分布式训练工具及TensorRT/ONNX Runtime推理优化技术;
3. 综合素质
(1)具备优秀的问题分析与解决能力,能快速跟进并复现领域内最新研究成果;
(2)拥有强烈的责任心与团队协作意识,具备清晰的沟通表达能力及跨部门协同效率;
(3)具备创新思维与技术钻研精神,能承受高强度项目压力,保障研发任务按时落地。
4. 加分项
(1)在CVPR/NeurIPS/ICLR等国际会议/期刊发表VLA、自动驾驶相关论文;
(2)有大规模(千亿参数级)大模型训练优化或智驾车端量产项目完整闭环经验;
(3)作为核心开发者维护过HuggingFace、MMLab等生态下高影响力开源项目,或在算法竞赛中取得优异名次。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕