2-2.5万
西工大创新大厦A座三层3006室
【岗位职责】
1、智能文本解析与结构化 (核心业务):
Ø 利用 LLM(GPT/DeepSeek/Llama 等)结合传统 NLP 技术(正则、关键词提取),负责对非结构化文档(如合同等)进行高精度的信息抽取、分类和结构化转换。
Ø 搭建高效的文本预处理工作流,包括:数据清洗、去重、分词、隐私脱敏及 Token 消耗优化。
2、Agent智能体开发与编排:
Ø 基于 LangChain / AutoGen
等框架开发 AI Agent,设计任务编排(Chain),实现复杂文本任务的自动化拆解。
Ø 实现 Agent 的工具调用(Tool Calling),让模型能够调用外部 API、查询内部数据库或执行特定代码。
3、效果调优与 RAG :
Ø 负责 Prompt Engineering(提示词工程) 的深度优化,通过 CoT(思维链)等技巧解决复杂语义理解问题。
Ø 搭建轻量级的 RAG(检索增强生成) 流程,解决长文本解析中的上下文限制与幻觉问题。
Ø (进阶)针对特定垂直领域的文本数据,进行小规模的模型微调(SFT/LoRA)以提升特定场景的效果。
4、工程落地与部署:
Ø 负责模型服务的 API 化封装与部署(Docker/FastAPI),保证接口的响应速度和高可用性。
【任职要求】
1、硬技能:
精通 Python,熟练使用 Pandas/Numpy 进行数据处理;熟悉 LangChain、LlamaIndex 等应用开发框架。
2、项目经验:
有 NLP(自然语言处理) 相关项目经验,做过文本分类、实体识别(NER)、文档解析项目者优先。
3、模型应用能力:
熟悉主流大模型 API 特性(Context Window,Function Calling),能通过 Prompt 和工程手段解决 Bad Case。
4、加分项:
了解 OCR 技术(PDF/表格/图片解析)或Data Agent;有爬虫或大规模数据清洗经验;了解向量数据库(Milvus/ChromaDB)。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕