职位描述
工作地点: 北京
实习时间: 能够保证至少连续实习 3 个月,每周出勤不少于 5 天。
我们是搜索技术团队,致力于打造业界领先的智能搜索体验。我们正在探索将前沿的大语言模型(LLM)技术深度融合到搜索的各个环节,从内容理解、生成到精准检索,不断突破信息获取的边界。如果你对搜索、自然语言处理、大模型技术充满热情,渴望在实战中快速成长,欢迎加入我们!
岗位职责:
1. 参与搜索内容生成: 探索和实践利用 LLMs(包括但不限于 GPT 系列、BERT 等)进行高质量、多样化搜索相关内容的生成与优化。
2. 优化内容检索与排序: 协助研发和改进基于 LLM 的语义理解、向量检索(Embedding)、混合检索等技术,提升搜索结果的相关性、准确性和召回率。
3. LLM 应用探索与迭代: 参与将大模型应用于搜索场景(如:Query 意图理解、智能问答、结果摘要、对话式搜索等)的原型设计、实验评估和效果迭代。
4. 垂类模型微调: 参与针对特定搜索领域或任务的语言模型 Fine-tuning 工作,提升模型在垂类场景下的表现。
5. RAG 技术增强: 协助进行 Retrieval-Augmented Generation (RAG) 系统的研发和优化,结合检索与生成,提高搜索答案的实时性、准确性和可靠性。
6. 前沿技术追踪: 关注 LLM、NLP 及搜索领域的最新技术进展,并进行相关的技术预研和分享。
岗位要求:
1. 学历背景: 计算机科学、人工智能、软件工程、电子信息、数学等相关专业在读本科、硕士或博士生。
2. 编程能力: 熟练掌握 Python 编程语言,熟悉至少一种深度学习框架(如 PyTorch、TensorFlow)。
3. 基础知识: 具备扎实的计算机基础知识,熟悉常见的数据结构与算法;对机器学习、自然语言处理(NLP)有较好的理论基础。
4. LLM 基础: 对 Transformer、BERT、GPT 等主流大语言模型有基本了解,理解其原理和应用方式。
6. 学习能力: 具备快速学习新知识、新技术的能力,对解决挑战性问题充满热情。
7. 沟通协作: 良好的沟通能力和团队协作精神,能够清晰地表达自己的想法并与他人有效合作。
加分项:
1. 在顶级会议(如 KDD, SIGIR, WWW, ACL, EMNLP, NeurIPS, ICML 等)发表过论文者优先。
2. 在国际/国内知名 AI 竞赛(如 Kaggle、天池、KDD Cup、NeurIPS Competitions 等)中取得优异成绩者优先。
3. 有搜索、推荐、自然语言处理、知识图谱等相关项目经验或实习经历者优先。
4. 有模型 Fine-tuning、Prompt Engineering、RAG 系统实践经验者优先。
你将获得:
- 深入接触前沿 LLM 技术在搜索领域落地应用的机会。
- 与资深算法工程师共同攻克技术难题,快速提升技术实力。
- 参与实际项目,你的代码和想法将可能影响千万级用户。
- 有竞争力的实习薪酬和福利。
- 潜在的转正机会。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕