核心研究方向(可选其一或交叉):
多模态感知与场景理解: 研究视觉-语言-触觉等多模态信息的融合算法,实现对动态、遮挡家庭环境的深度语义理解与三维重建;
具身认知与决策规划(具身智能大模型): 研究基于大模型的具身智能体,实现复杂任务的层级化分解、长时序规划以及在不确定环境中的在线推理与适应;
世界模型:研究针对特定场景的高质量的世界模型的高效生成,为具身模型的行为决策提供一定的状态预判(用于规划的世界模型),提升对场景的高效理解与数据合成(用于数据生成的世界模型);
机器人学习与灵巧操控:研究基于模仿学习、强化学习的泛化操控策略,让机器人能够安全、精细地完成家庭等场景的服务;
人性化的情感陪伴:研究人性化的人机交互范式,使机器人能够理解人类情感和意图,并提供主动、贴心的服务。
职位职责:
深入探索上述某一前沿方向,定义关键科学问题,提出原创性的算法解决方案;领导并推进高水平的研究项目,发表顶级会议(如 NeurIPS, ICLR, ICML, CVPR, ICRA, IROS, RSS, CoRL 等)或期刊(如 TPAMI, IJRR, TRO 等)论文;
与算法和工程团队紧密合作,将理论创新转化为技术原型,推动技术边界;
积极参与学术社区,与国内外顶尖研究机构合作交流。
任职要求:
近期(3 年内)或即将获得计算机科学、自动化、人工智能、机器人学等相关专业的博士学位;
在至少一个相关领域(计算机视觉、多模态计算、机器人学、大模型等)有深入的研究经验,并以第一作者身份在相关顶级会议或期刊上发表过论文;
具备优秀的数学和算法基础,熟练掌握 Python、C++等编程语言,精通 PyTorch, TensorFlow 等深度学习框架;
对科研充满极大热情,具备出色的发现问题、分析问题和解决问题的能力;
具备出色的沟通能力和团队协作精神。