岗位职责:
负责真实和仿真环境的多模态数据采集、清洗和增强等处理,构建高质量具身数据集,提升VLA模型的物理世界理解与推理能力。
1.针对具身智能模型训练的要求,设计数据采集方案;
2.构建跨模态数据清洗与对齐流程,处理文本、图像、视频、音频等多源异构数据。
3.开发数据增强与去噪工具,提升数据质量与模型泛化能力。
4.验证模仿学习与VLA算法在机器人任务中的有效性。
5.配合仿真团队,基于Isaac Sim/MuJoCo采集和生成合成数据,支持Real2Sim2Real流程。
任职要求:
1.计算机、模式识别、人工智能等相关专业硕士学位。
2.对具身智能大脑相关算法有一定的了解和理解。
3.精通Python,熟悉PyTorch、TensorFlow,掌握数据清洗与增强Pipeline设计。
4.良好的分析与解决问题的能力,具备团队协作精神。
5.具备机器人项目经验。