职位描述
岗位职责:
1. 核心问答引擎开发:
o 主导或参与基于大型语言模型(LLM)的智能问答系统的架构设计与开发,实现精准、流畅的自然语言交互。
o 负责将自然语言查询(NLQ)精准转化为数据库查询语言(如 SQL),并对查询结果进行解析和人性化呈现。
2. RAG(检索增强生成)能力建设:
o 设计和实施高效的 RAG 流程,结合内部知识库、数据文档和外部数据源,提升大模型回答的准确性、时效性和可追溯性。
o 持续优化向量数据库的构建、检索策略和 Embedding 模型,解决数据更新和知识迭代的挑战。
3. 模型微调与优化:
o 根据业务场景和特定数据集,对开源或商用的大型语言模型进行微调(Fine-tuning),以提升其在特定领域(如财务、销售、运营)的理解和生成能力。
o 负责模型效果的持续评估、监控和迭代优化,构建完善的评估体系(Evaluation Framework)。
4. 多模态能力探索与集成:
o 探索和集成多模态AI能力,使系统不仅能理解文本,还能解析图表、图片等多种形式的数据输入,并能生成可视化的数据报表或图表作为回答。
o 负责多模态数据的处理、特征提取和融合技术,打造更丰富的交互体验。
5. 数据与工程:
o 与数据仓库和数据平台团队紧密合作,确保数据链路的稳定和高效,深刻理解公司数据资产。
o 负责相关API服务的开发、部署和维护,保证系统的高可用和可扩展性。
任职要求:
必要条件:
• 计算机科学、人工智能、统计学或相关领域的本科及以上学历。
• 扎实的编程基础,精通 Python,熟悉常用的数据科学和机器学习库(如 Pandas, NumPy, Scikit-learn)。
• 深入理解大型语言模型(LLM)的原理和应用,有丰富的 Prompt Engineering 经验,熟悉至少一种主流 LLM API(如 OpenAI GPT系列, Anthropic Claude, Google Gemini 等)。
• 具备扎实的数据库知识,精通 SQL,并有处理复杂查询和性能优化的经验。了解数据仓库、数据湖等相关概念。
• 具备 RAG 的实战经验,熟悉 LangChain、LlamaIndex 等主流开发框架,并对向量数据库(如 Milvus, Pinecone, Chroma)有实践经验。
加分项:
• 有对话式AI(Conversational AI)、智能客服或聊天机器人(Chatbot)的开发经验。
• 具备 LLM 微调(Fine-tuning)的实践经验,熟悉 LoRA, QLoRA 等高效微调技术和相关工具(如 Hugging Face Transformers, PEFT)。
• 对多模态模型(如 CLIP, GPT-4V)有研究或实践经验,了解如何处理和融合图像、文本等多源信息。
• 熟悉 BI 工具(如 Tableau, Power BI, Looker)的原理或有相关开发经验。
• 有将AI模型部署到生产环境的经验,熟悉 Docker, Kubernetes 等云原生技术。
• 优秀的沟通能力和团队协作精神,能够清晰地表达技术概念并与产品、业务团队高效合作。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕