职位描述
核心职责
1、RAG 系统架构与研发
负责企业级 RAG(检索增强生成)知识库系统的设计与开发,覆盖文档采集接入、解析与预处理、切片与向量化、向量检索、结果重排、答案生成与引用溯源等全链路能力;主导或深度参与技术选型与架构设计,保障系统的可扩展性、高可用与可运维性,并持续迭代知识库增量更新、数据时效性与效果稳定性机制。
2、企业知识库问答场景落地
围绕智能问答、类智能文档助手、业务助手等应用场景,设计并实现切片策略、召回与重排策略、上下文构造与答案生成策略,优化检索准确率、生成相关性与业务可用性;结合业务反馈建立评测与持续优化闭环,推动从 PoC 到生产的工程化落地与迭代。
3、Prompt 工程与对话策略优化
针对多轮对话、复杂指令理解与业务约束场景,设计 Prompt 模板与对话编排策略,提升输出稳定性与一致性;建设 Prompt 版本管理、回归测试与 A/B 对比机制,以量化指标评估不同策略对业务效果的影响。
4、工具调用与插件体系建设(Function / Tool Calling)
实现大模型的工具调用能力,设计统一的工具/接口规范、参数校验、权限控制与异常处理机制;开发可扩展的工具插件体系,支持外部服务(如业务 API、数据库查询、检索服务等)的安全接入与治理。
5、AI Agent 架构设计与工程化交付
构建具备任务规划、执行、记忆与自我校验能力的智能体框架,支持复杂任务拆解与自动化执行;基于 Python/Java 完成服务化部署与性能调优(并发、延迟、稳定性、成本控制等),沉淀工程最佳实践与技术文档,支撑团队交付与能力复用。
任职要求
1、学历与经验
本科及以上学历,计算机科学、软件工程、人工智能、数学等相关专业;具备 3 年及以上后端研发经验,至少 1 年以上 AI 应用(RAG/智能客服/知识问答/Agent)相关项目实践经验;有从需求到上线的完整交付经历者优先。
2、RAG 与检索技术能力
理解 RAG 基本原理与关键工程环节,具备端到端 RAG 系统开发经验;熟悉向量化、向量检索、召回策略、结果重排(Re-rank)与上下文构造等方法;了解至少一种向量数据库/向量检索方案(如 Chroma、Milvus、FAISS、Elastic 向量检索等)的部署、使用与基础调优思路。
3、编程与工程能力(Python / Java)
熟练掌握 Python,能够使用 FastAPI/Flask 构建服务并进行工程化交付;熟悉 LangChain、LlamaIndex 等框架的使用与二次开发者优先;具备扎实的后端工程能力(接口设计、并发与性能优化、日志与监控、异常处理、配置管理等)。具备 Java 技术栈能力(Spring Boot/Spring Cloud 等)或能在 Java/Python 混合架构中协作开发者优先。
4、文档与数据处理能力
熟悉多格式文档解析与预处理流程,了解 OCR、NLP 清洗、结构化抽取等常见技术路线;具备数据处理基础能力(Pandas/SQL),能完成数据抽取、评测集构建与效果分析。
5、Agent 与工具调用能力(加分项)
了解 Function Calling/Tool Calling 机制,能实现工具协议、调用编排与安全治理;对 Agent 的任务规划、记忆管理、反思/校验等机制有实践或可落地方案者优先。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕