职位详情
强化学习算法工程师
面议
江淮前沿技术协同创新中心
合肥
1-3年
硕士
09-24
工作地址

安徽省合肥市高新技术开发区中安创谷科技园二期H6栋

职位描述
岗位职责
1 算法研发与创新: 负责设计、实现和测试基于强化学习的机器人运动控制策略,包括但不限于步态生成、平衡控制、轨迹规划、全身协调控制等。
2 仿真环境构建: 搭建高保真、高效率的物理仿真环境,用于大规模并行训练和快速算法迭代。优化仿真与现实的差异。
3 奖励函数设计: 针对复杂的运动任务,设计合理、高效的奖励函数,引导智能体学习稳定、节能、符合物理规律的运动技能。
4 Sim-to-Real 技术攻关: 主导并解决强化学习策略从仿真迁移到实体机器人过程中的关键问题,如系统延迟、模型失配、传感器噪声等,确保算法在真实世界中的稳定性和鲁棒性。
5 系统集成与部署: 将训练好的神经网络模型部署到机器人的实时控制系统中(如ROS 2),并与底层控制器(如MPC、WBC)进行集成和
6
技术跟踪与研究: 持续跟踪国际前沿的强化学习与机器人控制技术,并将有价值的新方法应用于实际项目,推动技术革新。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请