职位详情
机器人强化学习算法工程师
2-3万
成都安努智能技术有限公司
成都
1-3年
本科
12-06
工作地址

成德中心

职位描述
岗位职责
•负责具身智能中强化学习核心算法的设计、开发与优化,重点聚焦真机强化学习、带力控的强化学习场景,熟练应用PPO、SAC等主流强化学习算法,助力算法在真实机器人场景中稳定落地。
•负责强化学习算法落地开发(包含 reward 设计、策略训练、超参调优与性能边界评估),攻克真机训练稳定性、强化学习迭代效率和成功率提高等关键技术难题,确保机器人在相关任务中动作精准、鲁棒。
•负责基于 Isaac Sim等仿真平台的强化学习仿真环境搭建。
•负责推动强化学习算法从仿真环境到真实物理环境(sim2real)的高效迁移落地。
•基于 ROS(Robot Operating System)完成强化学习算法与机器人硬件(含力控模块)的集成部署,搭建真机强化学习测试环境,与团队协同排查算法与软硬件交互过程中的问题。
•利用 PyTorch/TensorFlow 等深度学习框架构建、训练和评估强化学习模型,处理算法所需的多源传感器数据(视觉、力觉、触觉等),优化数据预处理流程,提升模型在真机力控场景下的泛化能力与鲁棒性。
•参与强化学习实验方案设计与执行,重点针对真机训练、力控交互等场景制定测试计划,记录实验数据,分析训练效果与力控性能,撰写技术文档,推动算法迭代优化。
岗位要求
1.学历背景:本科及以上学历,计算机/自动化/机器人工程/电子信息工程/人工智能/控制工程等相关专业,研究生优先;
2.核心经验:具备真实机器人强化学习开发经验(如参与过真机强化学习项目、带力控模块的机器人强化学习开发、协作型工业机械臂/人形机器人强化学习真机部署调试等),熟悉机器人硬件结构,有过强化学习算法在实体机器人(含力控组件)上落地及sim2real(仿真到真机迁移)技术攻关或落地经历者优先。
3.算法能力:
(1) 精通强化学习核心原理与主流算法(PPO、SAC、DDPG、TD3、TRPO),深入理解sim2real关键技术(如域适应、动力学建模校准、仿真环境建模优化等);
(2) 掌握强化学习奖励函数设计、优化;
(3) 掌握机器人运动学、动力学基础,能独立完成和机器人学相关的强化学习子模块的开发与调试。
4.工具技能:
(1) 熟练使用 PyTorch/TensorFlow 等深度学习框架,具备强化学习模型构建、训练、调优经验,熟悉主流强化学习工具包(如 Stable Baselines3、RLlib、Spinning Up 等);
(2) 熟练使用 Isaac Sim 等仿真平台,能自定义模型与传感器插件;
(3) 精通 ROS(ROS1/ROS2 均可,ROS2 优先),能独立完成强化学习相关 ROS 节点编写、话题/服务通信、功能包开发与调试,熟悉 gazebo/moveit 等仿真工具,具备仿真到真机迁移的工程经验;
(4) 具备扎实的编程基础,熟练掌握 Python/C++,了解 Linux 操作系统常用命令与开发环境,具备良好的代码开发、调试能力,能高效处理力控传感器数据与强化学习训练数据。
5.综合素质:
(1) 学习能力强,对真机强化学习、力控强化学习领域有浓厚兴趣,能快速接受新技术、新工具,跟进强化学习领域前沿进展;
(2) 具备优秀的问题分析与解决能力,针对真机训练不稳定、成功率低等技术难题,能主动查阅资料、探索解决方案;
(3) 有责任心,工作认真细致,具备良好的团队协作意识与沟通能力,能清晰表达技术思路与项目进展;
(4) 具备领导力、抗压能力,结果导向,可适应因真机测试、项目交付所需的出差。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请