职位详情
大模型训练工程师(教育OCR识别与评分方向)
1.2-2.4万
成都兴唐信息技术有限公司
成都
1-3年
本科
08-21
工作地址

成都市武侯区长华路19号万科汇智中心1701

职位描述
岗位职责
  1. 负责搭建和优化大模型训练环境,包括硬件资源配置(GPU/TPU 集群)、分布式训练框架部署(如 PyTorch Distributed、DeepSpeed)及训练流程自动化,保障模型高效稳定训练。
  2. 主导 OCR(光学字符识别)与智能改卷场景的训练数据处理全流程:包括数据采集、清洗、标注规则制定、标注质量校验,构建高质量结构化训练数据集(如手写体文本、试卷版式、题型标签等)。
  3. 基于深度学习与大模型技术,设计并训练适用于 OCR 的文本检测、识别模型(如优化检测框精度、手写体字符识别准确率),以及智能改卷的评分模型(如题型匹配、答案相似度计算、得分规则建模)。
  4. 负责模型训练过程中的参数调优、性能监控与效果迭代,通过实验对比(如调整模型深度、学习率策略、数据增强方法)提升模型在实际场景中的鲁棒性(如复杂版式试卷、潦草手写体的识别效果)。
  5. 与算法研发、产品落地团队协作,输出训练模型的技术文档(如训练日志、参数配置、性能指标),支持模型部署与场景化应用验证。
  6. 跟踪大模型训练、OCR 技术及教育场景 AI 应用的前沿动态,将新技术(如小样本学习、领域自适应微调)落地到实际业务中,提升模型效果与效率。
任职要求学历与专业
  • 本科及以上学历,计算机科学、软件工程、人工智能、自动化、数学等相关专业;硕士学历优先,有相关领域研究经历者优先。
技能要求
  1. 编程语言:熟练掌握 Python,具备扎实的代码功底,能独立编写数据处理、模型训练脚本;了解 C++ 者优先。
  2. 深度学习框架:精通至少一种主流深度学习框架(PyTorch/TensorFlow),熟悉模型构建、训练 API 的使用,能独立搭建自定义网络结构。
  3. 大模型训练能力:具备大模型(如 LLM、视觉 - 语言多模态模型)训练或微调经验,熟悉分布式训练原理,能独立配置分布式训练环境并解决训练中的常见问题(如梯度爆炸、节点通信超时)。
  4. 数据处理能力:掌握数据处理工具(如 Pandas、NumPy、OpenCV),熟悉数据标注流程与工具(如 LabelStudio、CVAT),能设计标注规则并处理非结构化数据(图像、文本)的清洗与格式转换。
  5. OCR 与机器学习基础:
    • 理解 OCR 技术核心原理(如文本检测算法:YOLO、EAST;文本识别算法:CRNN、ViT-OCR),有 OCR 模型训练或优化经验者优先;
    • 掌握机器学习基础理论(如损失函数设计、优化器原理、过拟合抑制方法),能基于业务场景设计模型评估指标(如 OCR 准确率、改卷评分一致性)。
  6. 工程能力:具备良好的问题排查能力,能通过日志分析定位训练过程中的硬件、框架或数据问题;了解 Linux 系统操作,能编写 Shell 脚本或自动化工具提升训练效率。
经验要求
  • 1-3 年及以上大模型训练、深度学习算法开发或 OCR 相关项目经验;有教育场景(如试卷识别、智能批改)AI 模型训练经验者优先。
  • 有实际分布式训练项目经验(如百万级样本量、百亿参数模型训练),或主导过数据标注体系搭建项目者优先。
软技能
  • 具备较强的逻辑思维与实验设计能力,能通过系统化实验分析问题并提出优化方案。
  • 良好的沟通协作能力,能清晰表达技术思路,与跨团队高效配合推进项目。
  • 具备自驱力与学习能力,能快速适应 AI 技术迭代,主动探索解决复杂业务问题的方法。
加分项
  1. 发表过大模型训练、OCR 技术相关的学术论文,或有 Kaggle 等算法竞赛获奖经历。
  2. 熟悉大模型领域自适应微调技术(如 LoRA、QLoRA),或有小样本场景下模型训练经验。
  3. 了解教育行业业务(如试卷结构、考试评分规则),或有手写体识别、版式分析相关项目经验。
  4. 掌握模型压缩、量化技术,能在保证精度的前提下优化模型推理速度。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请