「深圳福田区强化学习算法工程师招聘」_2025年招商局创新科技(集团)有限公司招聘-智联招聘

职位详情

强化学习算法工程师

1.5-3万·18薪

招商局创新科技(集团)有限公司

深圳

不限

本科

03-26

工作地址

ISPSZHK深港国际科技园4层402B-406单元

职位描述

岗位职责：

1. 研究强化学习以及类强化学习技术，构造偏好数据、训练大模型、设计新架构。
2. 数据构造及标注管理
3. 完成大模型强化学习领域科技成果，包括但不限于论文和专利。

任职资格：

1. 人工智能、计算机、电子工程、自动化、数学、物理等相关专业毕业，获得硕士和博士学历，以及优秀本科毕业生。
2. 对以下方向中的至少其中一个有研究或项目经验：大模型、自然语言处理、深度学习、强化学习。熟悉分布式训练框架，如Megatron-LM和DeepSpeed，并具备多机多卡大模型训练经验者优先考虑。
3. 优秀的编程能力，ACM/ICPC、IOI等编程竞赛获奖者优先。
4. 具有良好的英语读写能力，可以完成英文论文写作。
5. 有高质量论文发表者优先 (如NIPS, ICLR, ACL, CVPR, ICCV, ECCV等)，有较强学术比赛经验者，有在开源社区有较大影响力者优先。
6. 理论基础扎实，有创新精神和深入思考能力。

以担保或任何理由索取财物，扣押证照，均涉嫌违法，请提高警惕