职位描述
岗位职责
参与大规模预训练语言模型的研发、优化和部署,包括但不限于:
模型架构设计:研究并设计高效、可扩展的模型架构,探索新型网络结构、注意力机制等。
模型训练与优化:负责大规模数据预处理、分布式训练、模型压缩、加速等,提升模型性能和效率。
模型应用与落地:将预训练模型应用于实际业务场景,如文本生成、机器翻译、问答系统等,并进行效果评估和优化。
任职要求
1、计算机科学、人工智能、数学等相关专业本科及以上学历。
2、专业技能:熟练掌握Python、C++等编程语言,精通常用深度学习框架(如PyTorch、TensorFlow等)。
3、精通自然语言处理、机器学习、深度学习等相关理论知识,熟练掌握Transformer、BERT、GPT等预训练模型。
4、熟悉开源的大语言模型,了解Prompt工程、常用的LLM微调方法、多模态技术。
5、具备扎实的算法和数据结构基础,熟悉分布式训练、模型压缩、加速等技术。
6、有大规模数据处理和推荐系统开发经验者优先。
7、具备良好的沟通能力和团队合作精神。
8、具备较强的学习能力和解决问题的能力。
9、对人工智能领域充满热情,具备良好的技术洞察力和创新意识。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕