1.数据标注与清洗:对文本、图像、音频、视频等多模态数据进行标注、分类、校对和清洗,确保数据质量符合模型训练要求。
2.数据质量把控:遵循标注规范,保证标注结果的准确性和一致性,定期复核标注结果并修正错误。
3.数据分析与反馈:记录标注过程中的常见问题,反馈数据分布偏差或标注难点,辅助模型优化。
4.工具与流程优化:熟悉标注工具,参与标注工具的测试和改进。
5.标注人员管理:不限于培训、答疑、质检、日常工作管理等。
1.有两年及以上数据标注或相关项目经验,有多模态多领域标注经验优先。
2.对AI和大模型有基本了解,理解数据标注对模型训练的重要性。
3.细心、耐心,具备较强的责任心和抗压能力。
4、有数据标注、内容审核、语言学分析相关经验者优先。
5、熟悉电力行业优先。
6、熟悉Python/SQL等基础工具,能进行简单数据处理者优先。