【岗位职责】
(实习3~4天/周 实习6个月以上)
1、跟踪并研究强化学习(Reinforcement Learning, RL)领域的最新研究进展,具备较强的论文阅读与复现能力;
2、基于目前的E2E算法,开发与之适配的RL策略,探索其在自动驾驶场景中的应用;
3、协助构建高质量的仿真环境与真实数据集,推动算法在实际任务中的泛化能力;
4、优化现有RL算法的训练效率与稳定性,提升策略收敛速度与性能表现;
【任职要求】
1.掌握python,熟悉pytorch框架,具备扎实的深度学习和大语言模型算法基础;
2.具备扎实的机器学习、深度学习与强化学习理论基础,熟悉常见RL算法(如DQN、PPO、SAC、TD3等);
3.熟悉OpenAI Gym、 Carla 、Unity ML-Agents等仿真平台;
4.计算机、信息、数学、电子、自动化、机械、测控、汽车等相关专业硕士及以上学历,具有扎实的数学功底和算法基础;计算机基础扎实,熟练掌握Python、Pytorch编程,熟悉Linux
5.熟悉Sparsedrive、VAD、driveVLM等端到端自动驾驶算法优先
【加分项】
有强化学习在真实系统(如机器人、自动驾驶等)中的应用经验;
熟悉多智能体强化学习(MARL)、元强化学习(Meta-RL)或层次强化学习(HRL);
掌握C++、CUDA等底层编程语言,具备高性能计算优化经验;
熟悉Ray RLlib、Stable-Baselines3、CleanRL等开源强化学习框架;