1、深度参与大语言模型的数据处理、prompt工程、模型训练、调优、系统评测和模型推理;
2、负责行业大语言模型应用,包括但不限于对话问答、信息提取、文本生成、序列决策等场景帮助团队达成目标效果和应用落地;
3、针对细分业务场景的数据处理、模型微调、prompt tuning等,以适应场景并达成业务目标;
4、参与设计行业大语言模型的应用方案设计。
任职资格:
1、硕士及以上学历,计算机类及相关专业优先;
2、熟悉python和常用的算法库和深度学习训练框架,有分布式预训练的经验,良好的开发能力;
3、了解常用的预训练模型与技术概念,如Transformer/BERT/GPT/T5/LayoutLM等,有多模态经验者优先;
4、对NLP主流大模型如GPT3/chatGPT/T5/LLaMA/GLM等的原理和差异有深入的理解和实际项目经验者优先;
5、有大模型、智能对话、知识图谱、搜索引擎等工业级系统算法开发实战经验者优先;
6、具有自主学习能力和自我驱动力。