职位详情
强化学习算法工程师
3-4.5万·13薪
广东瑞德智能科技股份有限公司
深圳
1-3年
硕士
11-28
工作地址

鹏森海纳中心玉塘街道玉塘社区光侨大道1163号2栋

职位描述
岗位职责:
1、负责将强化学习(RL)应用于机器人的运动控制,如步态自适应学习、高难度动作生成等;
2、在先进的物理仿真环境(如Isaac Gym, RaiSim)中,设计和训练用于机器人控制的RL模型;
3、研究和解决Sim-to-Real(从仿真到现实)的迁移问题,确保在仿真中训练的策略能成功部署到真实机器狗上;
4、将大型语言模型(LLM)或视觉语言模型(VLM)与机器人控制相结合,探索“指令->行为”的高层次任务规划与执行;
5、跟踪RL及AI for Robotics领域的最新研究成果,并推动其在项目中的创新应用。
岗位要求:
1、计算机、人工智能、自动化等相关专业硕士及以上学历;
2、精通Python,熟悉至少一种主流深度学习框架(PyTorch, TensorFlow);
3、深入理解强化学习主流算法(如PPO, SAC, DDPG等)及其原理;
4、具备扎实的机器学习和数学基础;
5、对机器人技术有浓厚兴趣,具备快速学习和动手实践能力。
加分项:
1、在机器学习或机器人顶级会议(如NeurIPS, ICML, ICLR, CoRL, ICRA)上有论文发表者;
2、有在物理仿真环境中训练机器人(特别是足式机器人)的实际项目经验者;
3、在Sim-to-Real、领域自适应(Domain Adaptation)、系统辨识(System Identification)方面有研究或实践经验者;
4、有大型模型(LLM/VLM)应用经验者。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请