2.5-4万
杭州卡涞复合材料科技有限公司
研究方向:视觉-语言-动作模型(Vision-Language-Action, VLA)结合人形机器人在高性能复合材料研发和智能制造中的应用与创新
研究背景与方向
随着大语言模型(LLM)的快速发展,视觉-语言-动作(VLA)模型已成为具身智能(Embodied AI)和通用机器人领域的核心前沿技术。VLA模型通过融合视觉感知、自然语言理解和动作生成,实现从人类指令到机器人执行的端到端闭环控制,能够显著提升机器人在复杂、非结构化环境中的泛化能力、指令跟随能力和长时序任务规划能力。
高性能纤维复合材料(连续纤维如玻纤,碳纤,芳纶纤维增强的聚合物)的研发和制造中长期面临产品研发难度高,批量数量波动大,工艺种类多且质量要求高等诸多挑战。传统的自动化技术难以适应复材行业的定制化,柔性化需求。聚焦于VLA模型与人形机器人的融合技术,构架“感知-理解-决策-执行”的一体化智能系统,通过人机协同,突破复合材料行业的设计优化,工艺控制,质量检测等核心瓶颈,实现降本增效与产业升级。
本课题组专注于VLA模型结合人形机器人在复合材料的创新应用,主要研究内容包括但不限于:
模型和方法研发
l 基于Transformer的多模态VLA基础模型设计与预训练
l VLA模型的动作预测机制优化
l 多模态数据对齐与高效微调
l 模拟到真实迁移(Sim-to-Real)、强化学习增强VLA、长上下文任务规划与世界模型融合。
l 实际机器人平台验证(重点在人形机器人多任务,如全身协调运动、双臂操作、步态导航与交互等)。
l 人形机器人硬件装配、传感器集成与底层软件调试
应用和验证
l 基于具体应用场景的方案实施和效果评估,包括但不限于以下方向
n 设计优化方向:开发基于自然语言的复合材料产品结构设计,优化,分析等生成式设计工具,通过VLA模型实现材料-结构-工艺的协同优化
n 工艺技术方向:构建VLA模型的关键工艺技术的智能化,如人机协同的织物预制体拼接,工艺参数分析,优化和实时调整,以及人机协同的复杂产品总成装配
n 质量检测方向:建立多模态(视觉/红外/超声)缺陷检测与根因分析模型,物料检测与比对,联动工艺参数修正
课题组拥有先进的人形机器人实验平台(包括全身多自由度人形机器人、力控传感器、高性能仿真环境)、高性能计算资源(多卡GPU集群),并与国内外知名实验室(如Figure AI、Tesla Optimus相关方向合作机构)以及高性能复合材料的领先企业有紧密合作。毕业生就业前景广阔,可进入顶尖高校、研究院或领先企业从事人形机器人与具身智能前沿研发。
申请要求
学历背景:计算机科学、人工智能、机器人学、自动化、电子工程、机械工程、复合材料工程等相关专业硕士毕业生(或优秀本科直博生)
专业技能
扎实的机器学习/深度学习基础,熟悉PyTorch/TensorFlow等框架。
有多模态学习(VLM/LLM)、计算机视觉、强化学习或机器人控制经验者优先。
熟悉ROS2、Transformer架构者优先。
有顶会论文发表经验(NeurIPS、ICML、ICLR、CVPR、RSS、CoRL、ICRA等)者优先。
强烈的科研兴趣和创新能力,良好的数学与编程基础。
英语流利,能顺畅阅读顶级论文并进行学术沟通。
优秀的团队协作精神,愿意动手参与人形机器人硬件装配、传感器调试、系统集成与真实场景实验。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕