岗位职责:
1. 前沿算法研究: 主导或深度参与世界级大模型(LLM/VLM)的核心算法创新,包括但不限于架构设计、高效训练、推理加速、多模态融合等。
2. 强化学习突破: 深入研究并实践高级强化学习(RL)技术,特别是大语言模型与强化学习(RLHF, RLAIF等)的结合与创新,解决复杂序列决策问题。
3. VLA具身智能探索: 开展视觉-语言-动作模型的前沿研究,推动其在机器人、自动驾驶、仿真智能体等领域的应用落地,实现从“感知理解”到“物理行动”的跨越。
4. 系统性工程实现: 将前沿算法思想转化为高效、稳定、可扩展的代码和系统,构建我们核心的技术壁垒。
5. 技术引领: 跟踪全球最新学术动态,发表高水平学术论文/专利,并参与制定团队的技术路线图。
岗位要求:
1. 学历背景: 计算机科学、自动化、机械工程、力学、电子工程、应用数学等相关专业的博士学位。
2. 研究方向: 博士期间的研究方向至少深度涉及以下一项或多项:
· 大语言模型/多模态大模型: 在模型预训练、微调、对齐、Agent应用等方面有扎实的理论基础和丰富的实践经验。
· 强化学习: 精通深度强化学习(DRL)经典算法,并有在复杂环境中(如游戏、机器人、仿真等)的成功研究或项目经验。
· 视觉-语言-动作模型: 在VLA、机器人学习、具身智能等领域有深入研究和项目实践,熟悉相关的仿真环境与实验平台。
3. 工程能力: 出色的编程能力,熟练掌握Python,并至少精通PyTorch、TensorFlow、Jax等主流深度学习框架之一。
4. 科研素养: 具备强烈的探索精神、出色的分析问题和解决问题的能力,以及优秀的团队协作和沟通能力。