岗位职责:
1、研究基于深度强化学习模型的机器人技能训练方法,增强机器人在各种任务中的表现;
2、搭建和维护强化学习环境,确保在仿真和实体中进行有效的训练和测试;
3、寻找新方法优化已有的 DRL 算法以适应特定的机器人应用场景;
4、设计和实施端到端的机器人学习方案;分析实验结果,调整和优化算法性能;
5、在强化学习、模仿学习等进行前沿技术研究,并应用这些技术到智能机器人的决策和控制系统中;
6、定期与团队分享研究进展,撰写技术文档。
任职要求:
1、硕士及以上学历,计算机科学、人工智能、机器人学或相关专业;
2、3 年及以上的强化学习和深度强化学习相关工作经验;
3、熟练掌握 Python 编程语言,以及使用 TensorFlow、PyTorch 等深度学习框架;
4、对 DRL 算法,如 Policy Gradients, Q-learning, DQN, A3C, PPO 等有深入研究和应用经验;
5、能够在模拟环境以及真实世界机器人系统中实施和调试 RL 算法优先;
6、良好的英语能力,能无障碍阅读英文技术文献优先。