职位描述
岗位职责
1. 负责基于大语言模型(LLM)的 RAG 系统设计与研发,涵盖数据处理、向量化、检索、生成等全流程。
2. 设计并实现高性能的文档预处理与向量化方案,支持大规模文档(百万级)数据的批量构建与增量更新。
3. 优化检索效果与响应速度,包括向量索引结构优化、多路检索融合(Hybrid Search)、重排序等技术。
4. 设计并实现知识库更新、版本管理与质量评估机制,确保数据的时效性与准确性。
5. 集成并优化多种大语言模型(开源与商用),实现低延迟、高并发的在线推理服务。
6. 与业务团队合作,基于业务场景设计提示词(Prompt Engineering)、上下文构造策略等,提高生成结果的可用性。
7. 监控与优化 RAG 系统的可用性、扩展性与稳定性,处理生产环境中的性能与质量问题。
任职要求
1. 教育背景:计算机、人工智能、软件工程等相关专业本科及以上学历。
2. 技术经验:
• 3 年及以上后端研发经验,至少 1 年 LLM 应用开发经验;
• 有大规模数据处理与检索系统(如 Elasticsearch、Milvus、FAISS、Weaviate 等)生产环境经验;
• 精通 Python 或 Java,熟悉常用 AI/ML 框架(PyTorch、Transformers、LangChain、LlamaIndex 等);
• 熟悉 RAG 技术原理与实现流程,包括向量化、索引构建、检索优化、上下文拼接、生成控制等。
3. 性能优化能力:
• 有应对百万级别文档构建与检索的性能优化经验,了解索引分片、分布式检索、缓存策略等;
• 具备大模型推理加速经验(模型量化、批量推理、流式输出等)。
4. 系统架构能力:
• 熟悉分布式架构设计,具备高并发服务开发经验;
• 熟悉云原生技术(Docker、Kubernetes)优先。
5. 加分项:
• 有企业级 RAG 项目落地经验,能提供案例;
• 熟悉中英文混合语料的检索优化策略;
• 有 Prompt Engineering、Agent 开发经验;
• 有向量数据库调优经验(HNSW、IVF、PQ 等)。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕