职位详情
算法工程师(RAG) - 多模态文档解析
1.8-3万
彩讯科技股份有限公司
广州
不限
本科
06-11
工作地址

中国南方航空(机场路店)

职位描述
一、公司介绍:

彩讯股份(证券代码:300634)创始于2004年,是国家高新技术企业,国家鼓励的重点软件企业。员工规模4500余人,其中研发及产品运营人员约占92%。拥有北京、广州、深圳、杭州、成都五处研发基地以及覆盖全国的运营网络。

公司主营智慧渠道、协同办公、智算服务与数据智能三大产品线,覆盖电信、金融、能源等多行业的大中型央国企,服务终端消费者超过10亿。基于多年积累的丰富的业务应用场景,结合公司全面AI战略,构建从AI原生云计算解决方案Rich AICloud、一站式AI应用开发平台Rich AIBox到垂直行业大模型应用解决方案的AI全栈服务体系,覆盖企业大模型应用开发全生命周期,助力AI技术的普及与深入应用。


二、职位描述:
我们正在寻找一位专注于多模态文档解析的 RAG 算法工程师,加入我们的前沿技术团队。你将专注于处理和解析各种多模态文档 (如 PDF、PPT、网页等),从中提取文本、图像、表格等信息,构建高质量的知识库,为 RAG 系统提供丰富的知识来源。你将有机会探索先进的文档解析技术,解决实际业务场景中的复杂文档处理挑战,并提升 RAG 系统对非结构化数据的理解能力。

【岗位职责】:
1、多模态文档解析技术研究与选型: 研究和选型各种多模态文档解析技术,包括但不限于 OCR (光学字符识别)、版面分析、表格识别、图像理解、信息抽取等技术。
2、文档解析流程设计与开发: 设计和开发高效、稳定的多模态文档解析流程,能够处理各种复杂格式的文档,并从中提取结构化和非结构化信息。
3、解析算法优化与定制: 针对不同类型的文档和业务需求,优化和定制文档解析算法,提升解析准确率和效率。
4、知识库构建与数据清洗: 将解析后的文档信息构建成结构化的知识库,并进行数据清洗、去噪、标准化等处理,保证知识库质量。
5、与 RAG 系统集成: 将文档解析模块与 RAG 系统有效集成,确保解析后的知识能够被 RAG 系统检索和利用。
6、文档解析性能优化: 针对大规模文档处理场景,优化文档解析性能,包括解析速度、资源消耗等。
7、技术文档编写与分享: 撰写技术文档、参与技术分享,沉淀文档解析经验,促进团队技术积累。

【任职要求】:
1、计算机科学、图像处理、自然语言处理或相关专业本科及以上学历。
2、熟悉多模态文档解析技术,包括 OCR、版面分析、表格识别、图像理解、信息抽取等。
3、有使用和优化开源文档解析工具 (如 Tesseract, PaddleOCR, LayoutParser, PDFMiner 等) 的经验。
4、了解 RAG (Retrieval-Augmented Generation) 技术原理,有 RAG 系统或知识库构建经验者优先。
5、熟悉图像处理、计算机视觉、自然语言处理 (NLP) 常用技术。
6、熟练掌握 Python 编程语言,熟悉常用的图像处理和 NLP 相关库 (如 OpenCV, Pillow, PyTesseract, SpaCy, Transformers 等)。
7、具备处理各种复杂文档格式 (如 PDF, PPT, Word, HTML, 网页等) 的经验。
8、良好的问题解决能力和动手能力,能够独立完成文档解析模块的开发和优化。
9、优秀的沟通能力和团队合作精神。
10、对文档解析技术发展趋势保持关注,乐于学习和探索新技术。

【加分项】:
1、有大规模文档解析项目经验者优先。
2、有处理特定行业文档 (如法律文档、财务报表、医疗报告等) 的经验。
3、熟悉深度学习在文档解析中的应用,如基于深度学习的 OCR、版面分析模型。
4、在文档解析、图像处理、NLP 相关领域发表过学术论文或有开源项目贡献者优先。
5、对知识图谱构建和应用有了解者优先。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请