岗位职责:
1.参与预训练模型的预训练、微调、强化学习阶段的构建以及模型训练迭代以及并行优化。
2.参与预训练语言模型的预训练、微调、强化学习阶段包括模型参数以及适配性等工作。
3.研究和设计各种大模型算法架构,并通过实验验证算法和模型的效果和性能。
4.处理和解决应用实践中遇到的各种问题,包括数据预处理、算法优化、模型调优、模型评估等方面的问题。
5.跟踪深度学习领域尤其大型预训练语言模型的最新发展和趋势,对新的技术和方法进行评估和研究,以提高团队的技术水平和能力。
任职要求:
1.学历:博士研究生
2.专业:计算机、数学或相关专业。
3.具有计算机相关资格证书者优先。
4.知识与技能水平要求:
(1)熟练掌握NLP和深度学习的相关理论和技术,如语言模型、机器翻译、文本分类、文本生成等;
(2)对数据敏感,具有优秀的逻辑思维能力,善于分析问题,解决问题;
(3)熟练掌握pytorch深度学习框架以及分布式深度学习框架,对deepspeed或oneflow有经验者优先;
(4)良好的团队协作能力,能够与团队成员和客户进行有效沟通;
(5)具有较强的分析和解决问题的能力,能独立解决复杂问题。