职位描述
核心职责
RAG系统设计与开发
构建端到端的RAG系统,包括文档加载、文本分块、向量化存储及检索生成模块。
优化文本分块策略(如重叠窗口、递归分割),提升检索准确性。
集成多源数据(PDF、Word、Excel等),支持非结构化数据处理。
检索与生成调优
实施混合检索策略(向量+关键词),结合重排序技术优化检索质量。
设计提示词模板,控制生成内容,抑制模型幻觉。
评估检索效果,开发补充搜索模块处理无效检索。
技术落地与维护
基于LangChain、FAISS/Chroma等框架搭建生产级系统。
部署Embedding模型(如HuggingFace、OpenAI),管理向量数据库。
开发前端交互界面(如Flask应用),提供用户友好的问答服务。
要求:
精通Python编程,熟悉Python 3.10+环境及常用库(如LangChain、Flask)。
深入理解RAG技术原理,包括向量相似度计算、检索器优化及生成控制。
具备文本处理经验,掌握文档分块、Embedding模型应用及向量数据库(FAISS/Chroma)部署。
熟悉大模型集成(如OpenAI/Azure OpenAI),能设计提示词并优化生成效果。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕