职位详情
强化学习工程师(年18-30万)
1.2-2.4万·15薪
外企德科
长沙
3-5年
本科
06-18
工作地址

长沙中电软件园10栋

职位描述
岗位职责:
1、开发、训练和部署用于运动和操作任务的强化学习算法;
2、构建模拟基础设施,支持大规模通用人形机器人运动和操纵策略的训练;
3、与控制团队合作,将策略集成到现有的控制堆栈中;
4、定义、测试和评估学习策略的性能指标等。

任职要求:
1、本科及以上学历,计算机、软件工程、自动化、电子信息、机械等相关专业;
2、熟练使用PyTorch编写生产质量代码;
3、熟悉在线和离线强化学习算法如PPO,SAC等;
4、熟悉常见的RL技术,例如:领域随机化、课程学习、奖励塑造等,具有调整这些RL算法的超参数和成本函数的经验;
5、熟悉通用ML评估工具,例如 TensorBoard、Weights&Biases等;拥有训练双足机器人运动策略经验者优先。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请