岗位职责:
1. 负责大语言模型技术生态的搭建与优化,包括模型架构设计、参数调整等,以提升模型性能和效率。
2. 主导语料制备工作,包括语料的收集、清洗、标注和管理,确保语料的质量和多样性,为模型训练提供有力支持。
3. 深度参与Agent训练过程,运用先进的训练算法和策略,提升Agent的智能水平和任务完成能力。
4. 构建和优化Agent网络架构,实现Agent之间的高效协同和信息共享,提高系统的整体性能和可扩展性。
5. 跟踪和研究大语言模型领域的前沿技术,探索新技术在团队产品中的应用场景,推动技术创新和产品升级。
6. 与团队成员紧密合作,包括研究人员、工程师、产品经理等,共同攻克技术难题,确保项目按时完成。
任职要求:
1. 计算机科学、人工智能、机器学习等相关专业硕士及以上学历。
2. 拥有3年及以上大语言模型相关领域工作经验,具备扎实的大语言模型理论基础和实践经验。
3. 熟悉主流的大语言模型架构(如Transformer等),并对语料制备、Agent训练、Agent网络等有深入的理解和实践经验。
4. 熟练使用常见的机器学习框架(如TensorFlow、PyTorch等),具备良好的编程能力(如Python等)。
5. 具备良好的团队协作能力和沟通能力,能够与不同背景的团队成员进行有效的合作。
6. 具有较强的学习能力和创新精神,能够快速掌握新技术,并将其应用到实际工作中。
7. 具备良好的问题解决能力,能够在复杂的情况下迅速找到问题的关键,并提出有效的解决方案。
专业及研究方向:
计算机科学、人工智能、机器学习等相关专业硕士及以上学历。