职位描述
职位描述:
分布式训练多模态算法算法工程化经验强化学习
岗位职责:
1. 负责强化学习相关技术的研发和实现,推进决策模型在虚拟人、游戏AI、智能NPC等决策领域和模拟仿真场景下的算法研究和实现的应用;
2. 参与深度强化学习相关的算法研究,包括但不限于离线强化学习,多智能体强化学习等,推动最前沿算法在各个领域研究进展;
3. 参与深度学习基础平台的功能迭代,持续研发算法与优化性能。
任职资格:
1. 计算机、数学、自动化等相关专业的硕士及以上学历,对交叉领域的决策AI算法有较大研究兴趣;
2. 具有4 年以上强化学习工作或研究经验,有优化理论、多智能体学习、分布式强化学习等经验,熟练使用 TensorFlow/PyTorch 等至少一种深度学习框架,有参与开源项目经验者优先;
3. 发表过顶会或者期刊论文,参与过国际竞赛的优先考虑。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕