职位描述
1.对接产品经理 / 业务方,深入理解业务场景(如企业知识库问答、智能客服辅助、法律 / 医疗文档检索、多轮对话系统)的核心需求,拆解为可落地的技术指标(如检索准确率、响应延迟、生成相关性、并发量)。结合业务场景特性,设计RAG 系统方案。
2.负责向量数据库(Milvus、Pinecone、Chroma、PostgreSQL pgvector)的部署、调优与运维,包括索引构建、分片策略设计、数据同步与更新机制实现。
3.集成主流大模型(GPT 系列、Claude、Llama 3、Qwen、通义千问等),实现 API 调用 / 本地化部署,处理模型调用的超时、重试、限流等异常场景。
4.设计高质量 Prompt 模板,优化 “检索结果→上下文注入→生成响应” 的链路逻辑。
5.实现检索结果与大模型的高效融合,确保生成内容严格基于检索到的权威信息,避免 “幻觉”。
6.开发多轮对话支持能力,维护对话上下文状态,实现 “历史对话→当前查询→精准检索→生成响应” 的闭环。
任职要求:
1.计算机相关专业本科以上学历,3年以上工作经验。
2.精通Python,熟练使用PyTorch/TensorFlow(模型微调)、LangChain/LlamaIndex(RAG框架)、Hugging Face Transformers(模型调用)等核心工具库;
3.深入理解向量检索相关算法(如FAISS、HNSW、IVF_FLAT等)的原理与适用场景;掌握字符串匹配、排序、过滤等基础算法,用于检索结果优化与数据清洗。
4.具备文档解析(PDF、Word、Markdown等多格式)、文本分割(语义分割、滑动窗口分割等策略)、去重去噪等预处理能力;熟练掌握文本向量化技术,了解不同嵌入模型(如BERT、Sentence-BERT、GPT-4 Embedding)的特性与选型逻辑,能根据文档类型优化向量化效果。
5.能独立设计检索架构(单阶段检索、多阶段检索如“召回+重排”);掌握检索策略调优方法,如查询改写(同义词替换、意图识别)、相关性排序(基于BM25、向量相似度、混合排序)、检索阈值设定等;具备检索效果评估能力,能通过MRR、Recall@k等指标量化优化效果。
6.理解RAG的核心逻辑,能优化“检索结果筛选与整合→上下文注入→生成响应”的全链路流程;具备解决融合过程中关键问题的能力,如上下文窗口溢出处理、无关检索结果过滤、多轮对话中的检索状态维护等。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕