职位描述
岗位职责:
1、研究并实现强化学习算法(DQN/PPO/SAC/A3C等)解决实际问题;
2、设计仿真环境(Gym/Unity/Mujoco等)和奖励函数,优化智能体策略;
3、结合深度学习(如Deep RL)提升智能决策能力;
4、探索多智能体强化学习(MARL)、模仿学习(Imitation Learning)等方向。
职位要求:
1、计算机、人工智能、数学、自动化等相关专业本科及以上学历;
2、编程能力:熟练Python,熟悉PyTorch/TensorFlow/JAX等框架;
3、算法基础:扎实的机器学习/深度学习/强化学习理论基础;
4、项目经验:
(1)模型方向:有CV/NLP/推荐系统等领域的模型训练和优化经验
RL方向:有机器人控制、游戏AI、自动驾驶等RL应用经验
(2)加分项(Nice-to-Have)
熟悉分布式训练(DDP/FSDP/Horovod)或大模型训练(LLM/RLHF)
有强化学习竞赛(如Kaggle、AI Dungeon)或论文发表(ICML/NeurIPS/ICLR)经验,熟悉CUDA优化、模型部署(TensorRT/Triton)或边缘计算(Jetson)。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕