工作内容:
1. 标注标准制定与优化:
● 负责大模型多模态(图像+文本)标注项目的需求分析、标注标准设计与持续迭代优化;
● 针对视觉语言理解任务(如图文匹配、视觉问答VQA、图像描述生成、细粒度视觉推理等),制定清晰、可执行的标注规范;
● 根据模型反馈和bad case分析,动态调整标注标准,提升数据对模型训练的有效性。
2. 标注团队管理与培训:
● 组织并培训内外部标注团队,确保其准确理解多模态任务的语义逻辑与标注要求;
● 设计标注培训材料与考核机制,提升团队在复杂视觉语义理解任务中的标注一致性与准确性;
● 持续监控标注过程中的典型错误,推动流程改进与质量提升。
3. 数据质量控制与交付管理:
● 主导标注数据的质量抽检、问题归因与闭环优化,确保交付数据符合大模型训练的高标准要求;
● 配合算法团队进行数据有效性验证,支持模型迭代中的数据需求响应;
● 建立数据质量评估体系,输出质量报告并推动系统性改进。
4. 跨部门协同与技术支持:
● 与算法、产品、工程团队紧密协作,深入理解VLM模型的技术需求,将算法目标转化为可落地的标注策略;
● 参与标注工具的设计与优化,提升标注效率与人机协同能力;
● 推动标注流程自动化与智能化,探索AI辅助标注的可行性路径。
岗位需求:
1. 教育背景与经验:
● 本科及以上学历,计算机、医疗、金融等相关专业优先;
● 2年及以上数据标注或数据质量管理经验,有大模型、多模态(VLM)、视觉语言任务(预训练、SFT)标注项目经验者优先。
2. 核心能力要求:
● 具备出色的多模态语义理解能力,能精准捕捉图像与文本之间的细粒度语义关联;
● 优秀的逻辑分析与问题诊断能力,擅长从bad case中提炼共性问题并提出解决方案;
● 熟悉主流视觉语言任务类型(如VQA、Captioning、Visual Reasoning、OCR+理解等)者优先。
3. 文档与沟通能力:
● 能独立撰写结构清晰、逻辑严谨的标注标准文档、培训材料与质量分析报告;
● 具备良好的跨团队沟通能力,能高效对接算法与工程团队,推动项目落地。
4. 技术视野与学习能力:
● 对AI大模型技术有浓厚兴趣,了解CLIP、BLIP、Qwen-VL、LLaVA、InternVL等主流VLM模型的基本原理与应用场景;
● 关注多模态AI领域前沿动态,具备快速学习新技术并应用于标注实践的能力。