职位详情
机器人感知与控制VLA算法工程师
2.5-4万
陕西中翰实德建设工程有限公司
西安
不限
硕士
01-20
工作地址

曲江国际金融中心(和谐路)901

职位描述

岗位职责:

l 负责抓取/采摘机器人的 VLA(Vision–Language–Action)智能决策体系设计与实现;

l 负责构建和优化复杂场景下的 视觉–语言–动作多模态模型,实现自主理解目标结构、抓取/采摘策略等语义信息;

l 负责基于 VLM/VLA 的 任务规划、动作生成、抓取策略生成等算法研发;

l 将 VLA 模型嵌入机器人控制栈,实现从高层语义目标到底层控制指令的映射;

l 负责构建多模态数据集(RGB、深度、点云、文本描述、语义标签),并开展自监督/弱监督训练;

l 将感知(检测、分割、姿态估计)与规划(轨迹生成、抓取点选择)整合进世界模型或通用 VLA 架构;

l 在 Jetson/ARM/NPU 平台上进行推理优化,实现可部署的轻量化 VLA 模型;

l 跟踪 OpenAI、VLAWorld、Pi0、RT-2、OpenVLA、Agricultural-VLM 等前沿研究成果,推动落地;

l 编写算法文档、接口说明与高层架构文档。

(2)任职需求与优先条件:

l 计算机、人工智能、机器人、多模态学习等相关专业硕士以上学历;

l 熟悉 C++/Python,具备扎实的深度学习工程能力;

l 精通多模态学习,包括视觉–语言预训练、跨模态对齐、动作预测等;

l 熟悉VLM/VLA 模型(如 OpenVLA、RT-2、VLAWorld、VIMA、RoboVQA)优先;

l 熟悉世界模型(如 DreamerV3、TD-MPC、MPC-based latent models)者优先;

l 熟悉机器人行为克隆 RLHF、Diffusion Policy 者优先;

l 熟悉 ROS1/ROS2、MoveIt、机械臂控制栈,有机械臂/户外机器人经验者优先;

l 在多模态、大模型、机器人学习等领域有论文、开源项目或工程落地经验者优先。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请