职位详情
强化学习算法研究员
3-5万
华院计算技术(上海)股份有限公司
上海
不限
博士
04-27
工作地址

上海

职位描述
岗位描述:
–设计和实现先进的强化学习算法,用于解决实际场景中的复杂决策问题;
–在多种环境中测试和优化强化学习模型的性能;
–与跨学科团队合作,将强化学习技术集成到实际应用中,如机器人、工业等;
–跟踪强化学习在大语言模型、通用人工智能等领域的最新进展,并结合公司的研发方向开展对应研究;
–将研究成果发表在顶会和期刊上。
任职要求:
–计算机科学、人工智能、数学、统计学或相关领域的博士学位;
–对现代强化学习算法有深入理解并有实际应用经验,如Q-learning、Deep Q-Networks (DQN)、Policy Gradient methods、Actor-Critic methods等;
–熟练掌握至少一种主流深度学习框架,如TensorFlow、PyTorch等;
–具备在模拟环境或实际应用中部署强化学习解决方案的经验优先考虑;
–具有出色的学习能力、解决问题能力、团队合作精神和良好的沟通技巧。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请