职位描述
岗位职责:
1多模态数据(视频+音频)的数据清洗、格式转换与元信息提取
2编写脚本,统计数据集关键指标(如时长分布/标注覆盖率)
3排查并处理 CSV/JSON 文件结构错误(错行转义/字段缺失)
4调用模型API实现自动化预标注(如语音转写/视频物体检测)
5 对人工标注结果进行批量检错,以及自动修复(如文本正则化)
任职要求:
1. 接收业务需求,根据需求制定具体标注规则;
2. 管理标注团队执行标注规则,质检和初步验收标注数据,保证数据高质量交付,为模型训练提供有效数据;
3. 以主人翁意识,推动项目进程,以结果为导向,解决项目中出现的问题;
4. 跨部门协作,协助技术人员完成标注平台的更新迭代,优化标注流程;
5. 参与内部人力资源的调控与更新;
6. 熟悉json、jsonl、csv、xlsx、md、mmd等文件字符串处理,精通python、js等有关批量字符处理语言。
有以下能力优先:
熟悉音频视频分析常用工具,如ffmpeg,yolo。
学习能力强、英语四级起、项目管理经验"
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕