岗位职责:
1. 研究强化学习以及类强化学习技术,构造偏好数据、训练大模型、设计新架构。
2. 数据构造及标注管理
3. 完成大模型强化学习领域科技成果,包括但不限于论文和专利。
任职资格:
1. 人工智能、计算机、电子工程、自动化、数学、物理等相关专业毕业,获得硕士和博士学历,以及优秀本科毕业生。
2. 对以下方向中的至少其中一个有研究或项目经验:大模型、自然语言处理、深度学习、强化学习。熟悉分布式训练框架,如Megatron-LM和DeepSpeed,并具备多机多卡大模型训练经验者优先考虑。
3. 优秀的编程能力,ACM/ICPC、IOI等编程竞赛获奖者优先。
4. 具有良好的英语读写能力,可以完成英文论文写作。
5. 有高质量论文发表者优先 (如NIPS, ICLR, ACL, CVPR, ICCV, ECCV等),有较强学术比赛经验者,有在开源社区有较大影响力者优先。
6. 理论基础扎实,有创新精神和深入思考能力。