职位描述
1、有大语言模型(LLM)预训练经验,熟悉相关技术细节和优化策略,如大规模语料收集、模型调优优化、自弱监督学习、强化学习等
2、熟悉NLP主流大模型,对模型背后的原理和各自适用场景有深入的理解;
3、熟悉一种以上大模型训练框架,如DeepSpeed、
Megatron、FSDP等;
4、NLP相关领域2年以上经验,具有扎实的算法理论基础,熟练掌握自然语言主要算法模型,如实体识别、知识抽取等。
5、具备有良好的代码开发能力,团队合作及沟通能力;
关键词:语言模型(LLM)、主流NLP模型(ChatGPT、GPT4、文心一言、PaLM API)至少一种、大模型训练、算法模型(满足80%再推);
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕