职位描述
岗位描述:
推动AI技术在工程成本领域的深度创新与应用,采用自然语言处理(NLP)和光学字符识别(OCR)等技术,解决工程造价领域中海量非结构化数据(如招标文件、合同文本、图纸注释和工程量清单表格等)的智能化处理难题。通过融合传统模型与大模型技术,主导实现核心业务场景的技术突破,驱动业务效率的质的飞跃。
技术要求:
1)NLP技术栈
精通实体识别、文本分类、信息抽取、文本相似度计算等传统NLP技术;精通PE、RAG(全链路)和模型微调,熟练使用 LangChain/LlamaIndex等构建面向文档的问答与分析应用。
2)OCR技术栈
精通基于深度学习的文本检测(如DBNet)与识别(如CRNN)模型。精通文档结构理解,包括表格识别、印章检测、关键信息抽取;熟悉多模态大模型在文档智能领域的应用。
3)工程化能力
精通Python,熟悉PyTorch/TensorFlow;具备将复杂NLP/OCR模型服务化(Docker,FastAPI)和构建稳健数据流水线的能力。
素质要求:
1)深刻理解数据质量(特别是标注质量)对NLP/OCR模型效果的决定性影响,并推动数据闭环的构建。
2)能快速理解“清标”、“组价”等业务的本质,并将其抽象为文档比对、知识检索、语义理解等可求解的技术问题。
3)能敏锐判断在特定场景下,使用传统模型方案还是大模型方案更能达到“成本-效益”的最优解。
任职资格:
1)硕士及以上学历,人工智能、计算机技术、软件工程、模式识别等相关专业。
2)5年以上AI算法经验,必须拥有3年以上以NLP或OCR为核心的项目实战经验,并有主导复杂项目的成功案例。
3)至少1年大模型(微调/RAG/应用开发)相关经验,有在NLP或OCR任务中具体应用的经验者优先。
4)有工程造价、档案信息化等行业知识背景者优先。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕