职位描述
【岗位职责】
1、数据标注、培训和质量把控:建立语音数据质检标准和流程,对创作、改写后的语音对话、TTS/ASR 数据进行全面质检;通过人工审核、交叉校验等方式,筛选出高质量数据,剔除存在歧义、错误或不符合要求的数据;对质检过程中发现的问题进行汇总分析,为数据优化提供依据,保障数据质量符合模型训练需求。
2、承接标注标准&撰写种子数据:主建OR承接专家在标注标准,撰写种子数据,并通过培训、赋能供应商标注团队执行标注,以及提升标注质量。涉及到语音数据的改写(对已有语音数据进行优化改写,提升文本的准确性、清晰度和语义表达)。
【任职要求】
1)学历背景:大学本科及以上学历,目标方言母语者或语言学、汉语言文学、方言研究相关专业优先,具备基本的英语听说读写能力,能够理解并转写部分粤英混数据。
2)方言能力:
吴语方言区native,精通吴语表达,能准确识别语义,听懂不同片区的吴语口音差异,口语表达符合粤语日常习惯;
了解目标吴语的基本词汇、语法结构,能准确区分方言与普通话的用词差异(如特有的名词、动词、语气词);
熟练掌握吴语拼音,能够使用吴语拼音进行文本输入。
3)专业技能:
具备基础的听力分辨能力,能识别音频中的方言语音细节。
熟悉电脑基本操作,会使用Excel等办公软件;
有吴语调研、吴语翻译或吴语语音数据处理相关经验者优先。
4)个人素质:
工作认真细致,有耐心,能承受重复性标注工作,对小众方言文化有一定兴趣和尊重。
具备较强的责任心和执行力,能按项目进度完成标注任务,主动反馈标注中的问题。
沟通能力良好,能配合团队执行方言标注规范,统一标注标准。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕