「郑州金水区 RAG研发工程师招聘」_2025年湖南拓维云创科技有限责任公司招聘-智联招聘

职位详情

RAG研发工程师

1.2-1.3万

湖南拓维云创科技有限责任公司

郑州

3-5年

大专

08-12

工作地址

龙湖金融岛

职位描述

岗位职责
1. 负责基于大语言模型（LLM）的 RAG 系统设计与研发，涵盖数据处理、向量化、检索、生成等全流程。
2. 设计并实现高性能的文档预处理与向量化方案，支持大规模文档（百万级）数据的批量构建与增量更新。
3. 优化检索效果与响应速度，包括向量索引结构优化、多路检索融合（Hybrid Search）、重排序等技术。
4. 设计并实现知识库更新、版本管理与质量评估机制，确保数据的时效性与准确性。
5. 集成并优化多种大语言模型（开源与商用），实现低延迟、高并发的在线推理服务。
6. 与业务团队合作，基于业务场景设计提示词（Prompt Engineering）、上下文构造策略等，提高生成结果的可用性。
7. 监控与优化 RAG 系统的可用性、扩展性与稳定性，处理生产环境中的性能与质量问题。
任职要求
1. 教育背景：计算机、人工智能、软件工程等相关专业本科及以上学历。
2. 技术经验：
• 3 年及以上后端研发经验，至少 1 年 LLM 应用开发经验；
• 有大规模数据处理与检索系统（如 Elasticsearch、Milvus、FAISS、Weaviate 等）生产环境经验；
• 精通 Python 或 Java，熟悉常用 AI/ML 框架（PyTorch、Transformers、LangChain、LlamaIndex 等）；
• 熟悉 RAG 技术原理与实现流程，包括向量化、索引构建、检索优化、上下文拼接、生成控制等。
3. 性能优化能力：
• 有应对百万级别文档构建与检索的性能优化经验，了解索引分片、分布式检索、缓存策略等；
• 具备大模型推理加速经验（模型量化、批量推理、流式输出等）。
4. 系统架构能力：
• 熟悉分布式架构设计，具备高并发服务开发经验；
• 熟悉云原生技术（Docker、Kubernetes）优先。
5. 加分项：
• 有企业级 RAG 项目落地经验，能提供案例；
• 熟悉中英文混合语料的检索优化策略；
• 有 Prompt Engineering、Agent 开发经验；
• 有向量数据库调优经验（HNSW、IVF、PQ 等）。

以担保或任何理由索取财物，扣押证照，均涉嫌违法，请提高警惕