初、中、高级人选 各1人
1. 计算机、人工智能、自然语言处理、数学、统计学等相关专业,本科及以上学历;
2. 3年以上NLP或者大模型领域相关经验,能够紧跟前沿论文中涉及的技术,理解机器学习、深度学习理论和算法知识和Transformer模型架构,具有一定的论文复现能力;
3. 能参与设计系统应用,独立负责核心子模块的设计、开发工作,比如多模态内容生成、智能客服等应用;
4. 熟练使用TensorFlow、PyTorch等深度学习框架,能根据业务需求使用BERT、GPT等框架解决实际问题;理解常用的优化算法,精通梯度裁剪、混合精度训练等技巧;掌握大模型微调(fine-tuning)原理和方式;
5. 对大规模数据处理和分布式训练有一定的经验,了解GPU、TPU等硬件加速器的使用和优化;
6. 精通Python,熟悉使用Java、Scala中至少一门编程语言。