「青岛市南区强化学习工程师（RL Engineer）招聘」_2025年青岛威瑞富泰能源有限公司招聘-智联招聘

职位详情

强化学习工程师（RL Engineer）已下线

1-2万

青岛威瑞富泰能源有限公司

青岛

3-5年

硕士

08-07

工作地址

远雄国际广场

职位描述

一、岗位职责：
1、研究并实现强化学习算法（DQN/PPO/SAC/A3C等）解决实际问题；
2、设计仿真环境（Gym/Unity/Mujoco等）和奖励函数，优化智能体策略；
3、结合深度学习（如Deep RL）提升智能决策能力；
4、探索多智能体强化学习（MARL）、模仿学习（Imitation Learning）等方向。

二、职位要求：
1、计算机、人工智能、数学、自动化等相关专业硕士及以上学历； 3年以上工作机经验。
2、编程能力：熟练Python，熟悉PyTorch/TensorFlow/JAX等框架；
3、算法基础：扎实的机器学习/深度学习/强化学习理论基础；
4、项目经验：
（1）模型方向：有CV/NLP/推荐系统等领域的模型训练和优化经验
RL方向：有机器人控制、游戏AI、自动驾驶等RL应用经验
（2）加分项（Nice-to-Have）
熟悉分布式训练（DDP/FSDP/Horovod）或大模型训练（LLM/RLHF）
有强化学习竞赛（如Kaggle、AI Dungeon）或论文发表（ICML/NeurIPS/ICLR）经验，熟悉CUDA优化、模型部署（TensorRT/Triton）或边缘计算（Jetson）。

三、福利待遇：
双休+六险一金+年终奖+部门奖金+节假日福利+生日福利+员工体检+员工旅游+电话补贴+交通补贴

以担保或任何理由索取财物，扣押证照，均涉嫌违法，请提高警惕