1. 和算法团队合作,产出各类型数据的标准定义,并将标准细化到数据生产各环节,保障数据生产中过滤、合成、改写等质量 2. 和标注团队对接,深入管理训练数据的标注、评估的工作,确保标准执行的质量,提高标注链路效率 3. 使用代码、 LLM、VLM 等工具,实现数据生产链路中的过滤、构造、送标等工作 4. 对数据生产链路、标注链路进行分析,基于数据洞察调整数据、标注策略等
1. 本科及以上学历,计算机科学、统计学、数学等理工科背景,或艺术设计类背景 2. 1-5 年工作经验,有大模型数据运营、标注任务管理经验者优先,有数据处理和编程能力者优先 3. 清晰的逻辑思维和数据意识,优秀的沟通与问题解决能力,有主动沟通习惯 4. 具备英文读写能力 5. 对视觉生成充满热情,有图像、视频生成等有深度使用经验者优先