1.3-1.8万
河南德泓工程管理咨询有限公司招商银行大厦21楼
岗位职责:
1. 负责基于大语言模型(LLM)的 RAG 系统设计与研发,涵盖数据处理、向量化、检索、生成等全流程;
2. 设计并实现高性能的文档预处理与向量化方案,支持大规模文档数据的批量构建与增量更新;
3. 优化检索效果与响应速度,包括向量索引结构优化、多路检索融合(Hybrid Search)、重排序等技术;
4. 设计并实现知识库更新、版本管理与质量评估机制,确保数据的时效性与准确性;
5. 集成并优化多种大语言模型(开源与商用),实现低延迟、高并发的在线推理服务;
6. 与业务团队合作,基于业务场景设计提示词(Prompt Engineering)、上下文构造策略等,提高生成结果的可用性;
7. 监控与优化 RAG 系统的可用性、扩展性与稳定性,处理生产环境中的性能与质量问题;
任职要求:
1. 教育背景:计算机、人工智能、软件工程等相关专业专科及以上学历。
2. 技术经验:
3 年及以上后端研发经验,至少 1 年 LLM 应用开发经验;
有大规模数据处理与检索系统(如 Elasticsearch、Milvus、FAISS、Weaviate 等)生产环境经验;
精通 Python 或 Java,熟悉常用 AI/ML 框架(PyTorch、Transformers、LangChain、LlamaIndex 等);
熟悉 RAG 技术原理与实现流程,包括向量化、索引构建、检索优化、上下文拼接、生成控制等。
3性能优化能力:
有应对大规模文档构建与检索的性能优化经验,了解索引分片、分布式检索、缓存策略等;
备大模型推理加速经验(模型量化、批量推理、流式输出等)。
4. 系统架构能力:
熟悉分布式架构设计,具备高并发服务开发经验;
熟悉云原生技术(Docker、Kubernetes);
有企业级 RAG 项目落地经验,能提供案例;
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕