「深圳光明区强化学习算法工程师招聘」_2026年广东瑞德智能科技股份有限公司招聘-智联招聘

职位详情

强化学习算法工程师

3-4.5万·13薪

广东瑞德智能科技股份有限公司

深圳

1-3年

硕士

11-28

工作地址

鹏森海纳中心玉塘街道玉塘社区光侨大道1163号2栋

职位描述

岗位职责：
1、负责将强化学习（RL）应用于机器人的运动控制，如步态自适应学习、高难度动作生成等；
2、在先进的物理仿真环境（如Isaac Gym, RaiSim）中，设计和训练用于机器人控制的RL模型；
3、研究和解决Sim-to-Real（从仿真到现实）的迁移问题，确保在仿真中训练的策略能成功部署到真实机器狗上；
4、将大型语言模型（LLM）或视觉语言模型（VLM）与机器人控制相结合，探索“指令->行为”的高层次任务规划与执行；
5、跟踪RL及AI for Robotics领域的最新研究成果，并推动其在项目中的创新应用。
岗位要求：
1、计算机、人工智能、自动化等相关专业硕士及以上学历；
2、精通Python，熟悉至少一种主流深度学习框架（PyTorch, TensorFlow）；
3、深入理解强化学习主流算法（如PPO, SAC, DDPG等）及其原理；
4、具备扎实的机器学习和数学基础；
5、对机器人技术有浓厚兴趣，具备快速学习和动手实践能力。
加分项：
1、在机器学习或机器人顶级会议（如NeurIPS, ICML, ICLR, CoRL, ICRA）上有论文发表者；
2、有在物理仿真环境中训练机器人（特别是足式机器人）的实际项目经验者；
3、在Sim-to-Real、领域自适应（Domain Adaptation）、系统辨识（System Identification）方面有研究或实践经验者；
4、有大型模型（LLM/VLM）应用经验者。

以担保或任何理由索取财物，扣押证照，均涉嫌违法，请提高警惕