职位描述
- 负责人工智能训练用音频数据的预处理与优化,针对语音识别、声纹识别、情感分析等模型需求,进行降噪、去回声、截幅修复等处理,提升数据纯净度。
- 制定音频数据标准化处理流程,包括格式统一(如 WAV/PCM 转换)、采样率(16k/44.1k 等)与比特率校准、声道分离 / 合并等,确保数据符合模型训练输入规范。
- 对音频数据进行标注辅助处理,如精准切割语音片段、提取人声特征片段、标记静音 / 有效语音区间等,配合标注团队提升数据标注效率与准确性。
- 参与音频数据质量评估体系搭建,设计基于 AI 模型反馈的处理效果验证方案,通过对比处理前后模型识别准确率,优化处理参数与策略。
- 针对低质量音频(如远距离录音、强背景噪音、方言混杂)开发专项处理方案,通过算法辅助(如光谱分析、AI 降噪模型微调)提升数据可用性,扩充训练数据覆盖范围。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕