职位详情
VLA大模型智驾算法工程师/专家
6.5-10万
广州市必用企业管理咨询有限公司
合肥
3-5年
硕士
01-15
工作地址

沱河路517号

职位描述
岗位职责:
负责基于 VLA(视觉 - 语言 - 行动)、VLM/LLM 大模型的自动驾驶核心算法研发,聚焦多模态数据(图像、文本、传感器信号)对齐、融合与模型训练 / 微调,攻克时空一致性、场景理解等关键技术难题;
主导或核心参与端到端自动驾驶系统开发,覆盖感知增强、轨迹预测、路径规划、决策控制等核心任务,适配城市 NOA、无图驾驶等复杂智驾场景;
负责 VLA 大模型的工程化落地,包括大规模分布式训练(DeepSpeed/FSDP)优化、车端嵌入式平台(TensorRT/ONNX Runtime)适配、模型量化 / 剪枝等推理性能优化;
搭建多模态数据处理 pipeline,涵盖数据集(nuScenes/Waymo 等)清洗、标注、增强,支撑模型迭代与算法效果验证;
跟踪 RT-2、OpenVLA 等主流 VLA 模型前沿技术,结合业务场景进行技术创新与落地,提升智驾系统的泛化能力与安全性;
参与智驾算法量产项目交付,协同测试、工程团队完成实车调试、问题定位,保障算法满足量产指标;
(专家岗额外)主导技术方案设计、跨团队技术协作,培养算法团队核心能力,推动前沿技术在智驾领域的产业化应用。
三、任职要求
1. 基础条件
学历:硕士及以上学历(专家岗优先博士),计算机科学、人工智能、机器人学、自动化、车辆工程等相关专业;
经验:工程师岗 3 年 +、专家岗 5 年 + 自动驾驶 / 机器人领域算法研发经验,有 VLA/VLM 大模型或端到端智驾项目经验者优先。
2. 核心技术能力
模型理论:精通 VLA/VLM/LLM 模型架构与训练逻辑,深入理解多模态数据融合、对齐技术;掌握模仿学习、强化学习、Diffusion Models 等算法,清楚其在自动驾驶场景的应用逻辑;
工程能力:熟练运用 Python,专家岗需掌握 C++;精通 PyTorch 深度学习框架,熟悉 DeepSpeed/FSDP 等分布式训练工具;具备模型量化、剪枝、TensorRT/ONNX Runtime 推理优化能力;
场景与数据:熟悉 nuScenes、Waymo 等主流自动驾驶数据集,能独立搭建数据处理流程;理解自动驾驶感知、决策、规划核心任务,具备复杂交通场景算法适配能力;
工具与系统:熟悉传感器融合(LiDAR/Camera)或 ROS 系统,具备实车调试、问题定位能力。
3. 项目经验
有端到端自动驾驶或机器人领域 VLA 大模型训练、微调及落地经验;
具备大规模(千亿参数级)大模型训练优化或车端嵌入式平台适配经验;
参与过城市 NOA、无图驾驶等智驾量产项目,有完整的算法研发 - 交付闭环经验。
四、加分项
学术成果:在 CVPR、NeurIPS、ICLR 等顶级国际会议 / 期刊发表 VLA、自动驾驶相关论文;
竞赛与开源:在 ACM-ICPC、CCPC 等算法竞赛中取得优异名次,或作为核心开发者维护 HuggingFace、MMLab 等生态下高影响力开源项目;
额外技能:掌握 CUDA Kernel 自定义算子开发、具身智能或人机交互相关技术;
行业资源:具备智驾行业核心供应链或技术合作资源,能推动项目高效落地。
完善的职业发展通道(技术 / 管理双路径)与培训体系。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请