职位详情
模型训练数据清洗和处理(ASR/TTS方向)
1-1.1万
亿达信息
深圳
1-3年
大专
01-28
工作地址

万利达科技大厦1

职位描述
岗位要求:1. 负责海量音视频数据、文本数据的收集、管线清洗、标注及后处理等工作,涉及前处理、vad、asr、tts、质量评分等。
2. 对已有数据进行质检、修正错误等
3. 构建高质量sft数据集,提升模型训练效果
4. 优化各标注工具准确度、效率等。
岗位职责:1. 1-3年工作经验,本科及以上学历;
2. 对音视频数据、文本数据等有一定的处理经验,熟悉各种数据格式的特点及处理方式
3. 对前处理、asr、tts等模型方案有一定的使用经验
2. 深度体验或使用过如deepseek、文心、豆包、KIMI、GPT等大模型产品,行业敏感度高,充分了解AI数据标注工作;
3. 理解AI大模型的能力边界和技术原理,对大模型效果的理想态有全面认识;
4. 有一定文笔和创作经验,对不同场景、类型的问题能作出理想回答,
5. 具有一定的组织协调能力和团队协作能力。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请