8000-16000元
广东广州天河区天河北路233号中信广场
岗位职责:
1. 跟踪RAG及大模型相关技术的最新发展趋势(如多模态检索、增量更新算法、混合检索、GraphRAG等),探索前沿检索算法、语义分块技术和生成优化方法,跟踪 RAG 领域前沿技术,持续推动技术创新,推动技术方案升级;
2.RAG 技术方案设计与落地:主导 RAG 系统全生命周期建设,包括知识库构建(非结构化数据清洗、结构化存储)、检索算法选型(向量检索、语义检索等)、生成优化(prompt 工程、上下文融合),确保系统适配企业业务场景;
3. 技术优化与问题解决:持续优化 RAG 系统性能,包括检索速度、生成准确性,针对业务反馈的检索偏差、回答错误等问题,快速定位原因(如知识库更新不及时、检索算法参数不合理)并迭代优化;
4.对关键业务实现提供技术支持,解决团队成员开发过程中遇到的问题,如能根据模型上下文窗口大小(如 4k/8k/32k)、token 消耗成本,设计适配的 RAG 拆分与拼接策;
5.负责服务的交付与运营,责任心强,端到端完成AI服务的定制化改造,能力对接与业务系统落地,并为业务系统提供运营保障。
1.计算机科学与技术、软件工程、人工智能等相关专业本科及以上学历,2年以上 RAG 相关技术研发经验。
2.基础技术栈:熟练掌握 Python 编程语言,精通 NLP 常用框架(如 Hugging Face Transformers、LangChain、FAISS),具备向量数据库(如 Milvus等)的部署与调优经验。
3.RAG 实操能力:有完整 RAG 系统落地经验,熟悉 “数据预处理 - 知识库构建 - 检索策略设计 - 生成优化- 测试上线 - 运维优化” 全流程,能独立解决检索召回率低、生成内容与上下文脱节等问题。
4.模型适配能力:了解主流大模型(如 QWEN/DEEPSEEK系列)的特性,能根据业务场景选择适配的基础模型,具备大模型微调(LoRA、QLoRA)或 上下文工程经验者优先 。
5.具备 RAG 系统性能调优经验,能通过检索层优化(向量索引压缩、缓存策略设计)、生成层优化, RAG 端到端响应时延控制,满足实时业务需求;
6.可以在压力下识别问题并制定解决方案。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕