主要职责:
1.参与RAG(检索增强生成)系统的设计、开发、测试和优化,包括知识库的构建、索引的创建、检索算法的实现和评估。
2.协助构建基于大型语言模型(例如DEEPSEEK、千问等)的智能对话机器人,参与对话流程的设计、模型的微调和评估。
3.研究和探索最新的RAG和LLM相关技术和方法,例如更先进的检索策略、更有效的上下文融合技术等。
4.参与知识库的建设和维护,包括数据清洗、数据标注和知识抽取等工作。
5.协助进行系统性能的评估和监控,发现并解决潜在的技术问题。
6.参与编写技术文档和研究报告,分享学习和实践经验。
7.根据项目需求,参与其他与自然语言处理和生成式AI相关的任务。
能力要求:
1.计算机科学、软件工程、人工智能、自然语言处理或相关专业本科或硕士在读学生。
2.对人工智能、自然语言处理和机器学习领域有浓厚的兴趣和一定的了解。
3.熟悉Python,具备良好的编程基础。
4.了解RAG(检索增强生成)的基本原理和流程,有相关项目经验者优先。
5.对大型语言模型(LLM)有一定的了解,熟悉常用的模型架构和应用场景。
6.具备良好的学习能力、沟通能力和团队合作精神。
7.能够积极主动地解决问题,并对技术细节有深入的理解和追求。
8.每周能保证至少5天的实习时间,实习期至少6个月。
加分项:
1.有使用Dify等相关工具的经验。
2.有使用Hugging Face Transformers库的经验。
3.参与过开源NLP项目或相关竞赛。
4.熟悉信息检索、提示工程、知识图谱等相关技术。
5.有搭建和部署AI应用经验者优先。