职位详情
强化学习算法工程师
1.1-1.8万
沈阳航盛科技有限责任公司
沈阳
1-3年
硕士
05-14
工作地址

辽宁省沈阳市皇姑区塔湾街

职位描述

岗位职责:

1. 负责强化学习(RL)算法的研究、设计与实现,应用于智能决策、控制优化等领域;

2. 结合业务需求,设计并训练强化学习模型,提升智能体在复杂环境中的表现;

3. 跟踪强化学习领域前沿技术,探索创新算法并推动落地应用;

4. 编写技术文档,输出算法方案,并与工程团队协作完成系统集成。

任职要求:

1. 学历背景:硕士及以上学历,计算机、人工智能、自动化、数学等相关专业;

2. 技术能力:

- 熟悉经典强化学习算法(如DQN、PPO、SAC等),掌握深度强化学习(DRL)框架;

- 熟练使用PyTorch/TensorFlow等深度学习框架,具备RL算法实现与调优经验;

- 熟悉MDP、POMDP、多智能体强化学习(MARL)等技术者优先;

3. 项目经验:

- 有机器人控制、游戏AI、自动驾驶、资源调度等RL相关项目经验;

- 在ICML、NeurIPS、ICLR等顶会发表论文者优先;

4. 其他要求:

- 扎实的数学基础(概率统计、优化理论等);

- 良好的编程能力(Python/C++),熟悉Linux开发环境;

- 具备较强的学习能力和团队协作精神。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请