1.8-3.5万·13薪
明新旭腾新材料股份有限公司
核心职责:
· 异构数据清洗与标准化:针对各业务域数据的跨系统不一致问题,设计语义匹配与对齐算法,构建企业级统一数据视图。
· 非结构化文档智能化处理:利用 OCR、文档解析大模型(如 Codex)等技术,从海量 PDF 合同、技术图纸、工艺文件、审批单中提取结构化信息,并转化为 AI 友好的格式(Markdown/JSON)。
· 回写校验与闭环治理:设计 AI 生成数据(如预测结果、决策指令)写回源系统的校验逻辑,确保映射准确、符合业务规则及内控要求,形成数据闭环。
· 主数据与元数据管理:统一集团各业务域的核心字典(物料编码、客户档案、科目表、成本中心、人员组织等),建立企业知识图谱的底层语义关联,支撑 RAG 体系的精准检索。
任职要求:
· 精通 SQL、Python (Pandas) 及主流 ETL 工具,有数据仓库或数据中台建设经验。
· 熟悉数据流水线设计(如 Apache Airflow、n8n 或云原生工作流),能构建稳定可靠的数据处理链路。
· 有丰富的非结构化数据处理经验,熟悉文档分片 (Chunking)、Embedding 及向量化检索策略。
· 加分项:
o 具备制造业“订单到现金 (O2C)”、“采购到付款 (P2P)”、“计划到生产 (I2P)”等端到端流程梳理经验者优先。
o 熟悉主流向量数据库(Milvus、AnalyticDB PostgreSQL、Pinecone 等)的性能调优与运维。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕