岗位职责:
1、开发大模型在各种应用场景中的应用,重点关注人机交互方面;负责语言大模型/多模态大模型的分析和性能调优
2、深入理解业务,进行重点难点技术攻关工作,将技术实现与业务场景联系起来,快速解决业务需求问题。
3、研究最新的自然语言处理算法,并将其应用到我们的系统中,提高平台的性能和竞争力;
4、负责算法的性能测试和调优、Prompt设计、对预训练模型的分布式、加速训练及模型蒸馏、部署,保证算法的准确性和效率;与团队合作,不断改进和优化算法,推动平台技术的发展。
5、负责大语言模型的训练、对齐、调优以及下游应用落地等相关工作,对大模型进行预训练、微调、服务化等,对接业务需求,针对具体方向,提高准确性和可用性
任职资格:
1、计算机科学、人工智能相关专业硕士及以上学历,具备从事NLP、大语言模型(LLM)预训练算法研究、基础大模型训练经验(科研、工作经验均可);
2、熟悉LLM大模型基本原理及应用、Langchain框架及应用,有GPT大模型研发经验者优先。
3、深入掌握机器学习和深度学习,熟悉Tensorflow/PyTorch框架,熟练掌握GPT/Llama /BERT/Transformer框架;
4、熟悉Linux系统,熟练使用Python语言进行开发,数学理论基础扎实,编程实现能力高效;
5、有良好的沟通表达能力,积极向上,细致认真。