职位详情
研发工程师(人工智能)
2.5-3.5万
北京富迪广通科技发展有限公司
北京
3-5年
硕士
05-29
工作地址

金隅大成时代中心写字楼2601

职位描述
职位介绍
1、研究基于深度强化学习的智能决策和CGF智能控制技能训练方法, 增强仿真系统和模型在各种任务中的智能表现。
2、搭建和维护强化学习环境,确保基于仿真推演系统的智能模型有效训练和测试。
3、寻找新方法优化已有的DRL算法以提升智能模型的应用场景适应能力。
4、分析实验结果,调整和优化算法性能。
5、定期与团队分享研究进展,撰写技术文档。

岗位要求
1、硕士及以上学历,计算机科学、人工智能、系统仿真或相关专业。
2、具有强化学习和深度强化学习相关工作经验。
3、熟练掌握Python编程语言,以及使用TensorFlow、PyTorch等深度学习框架;熟悉Ray分布式计算框架者优先。
4、对DRL算法,如Policy Gradients,Q-learning, DQN,A3C,PPO等有深入研究和应用经验。
5、能够在仿真推演环境中实施和调试RL算法;熟悉JS仿真推演系统开发和建模者优先。
6、有较强的独立工作能力,具有良好的团队合作意识。
7、有大模型应用和Agentic AI开发经验者优先。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请