职位描述
【岗位职责】:
1. 带领团队负责具身智能、机器人操作算法等核心前沿方向的算法应用;
2. 完成各类具身智能算法(VLA、强化学习、pick and place分层框架等pipeline)的训练与场景部署
3. 参与制定技术规划,带领开发团队完成场景中任务验证,评估场景任务可行性,把握具身智能中的计算机视觉、机器人学、强化学习等前沿发展趋势。
【任职要求】:
1. 计算机科学、人工智能或其他相关领域的硕士及以上学历;
2. 具有1.5年以上的模仿学习、行为克隆或者VLA的研究/开发经验,理解各类baseline如ACT、Diffusion Policy、octo、Pi、Groot、RDP等底层原理。有完成各类操作子单元、长程操作任务的采集、清洗、训练、部署全流程经验。
3. 具有 1.5 年以上强化学习工作或研究经验, 理解强化学习中的DQN、DrQv2等变种算法,理解Policy-Gradient算法原理,能够复现应用Actor-Critic、A2C、A3C、PPO等经典算法,了解其背后的数学原理。有在线强化学习、持续强化学习、从仿真到实物完成机械臂操作任务、SERL算法、 Population Based Training等经验者优先;
4. 精通Python、熟悉C++编程语言。熟练掌握 IsaacGym、ManiSkill、Mujoco、Genesis等仿真环境,深入了解仿真器底层、具备搭建Benchmark经验者优先。
5. 具备机械臂任务和运动规划、6D抓取位姿估计、三维物体重建、大语言模型驱动的通用操作语义表达。
6. 熟悉应用各类神经网络结构如Transformer,Diffusion,VAE,CNN,LSTM,GRU,GAN等;熟练使用 PyTorch/TensorFlow 等至少一种深度学习框架,具备JAX、CUDA等加速运算库经验者、参加过知名开源项目开发者优先。
7. 具备优秀的软件工程能力,熟练使用Python,torch及 Linux 操作系统,熟悉代码文档、单元测试、版本控制等基本操作,并熟练使用 Git, CMake 等软件工程相关工具;
8. 在顶级国际会议和期刊上发表过相关学术论文者优先
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕