职位描述
Python开发工程师(大模型与视觉方向)
职位描述
工作内容及工作职责
1. 负责PDF文档解析、还原,解析OCR识别不可解析PDF后输出的复杂数据结构,基于该结构生成与原文件具有相同格式的PDF文件
2. 参与训练平台核心模块开发,设计并实现模型微调、训练管理、数据准备、评估与部署自动化等功能,支持OCR模型及大模型的迭代与优化。
3. 构建自动化数据采集与管理系统,开发多语言数据爬取、清洗和标注工具,实现高质量训练语料的高效获取、存储和生命周期管理。
任职要求
1. 精通Python开发,熟悉Web框架如fastapi,具备良好的代码规范
2. 熟练使用pandas、numpy等数据处理库,能开发高效的数据处理工具
3. 了解爬虫技术,有使用Scrapy或Selenium开发爬虫系统的经验优先
6. 加分项:具备前端开发能力、了解OCR基础知识、熟悉Docker部署流程
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕