【岗位要求】
1、本科及以上学历,计算机相关专业或数学专业,1年以上开发经验;
2、扎实的编程基础,精通PYTHON,熟悉一种或多种深度学习框架(Pytorch/TensorFlow)作为加分项;
3、熟悉 Linux 常用命令,掌握在 Linux 下搭建环境及开发部署测试,熟悉docker镜像操作和部署;
4、在大模型、算法、语音、图像处理等一个或多个领域有扎实的理论基础和丰富的实战经验优先;
5、具有音频数据处理相关技能如ffmpeg,torchaudio,librosa,pydub,wave等优先;
【工作职责】
1、负责多模态大模型数据语料(语音、视频、图像、文本等)生产和处理,包括但不限于数据生成增强、分布研究、数据获取、数据规范化、数据质量检测、打标等,确保训练数据的有效性,可用性;
2、负责优化和改进现有的数据清洗和质检打标流程,提高效率和准确性;
3、负责大模型相关数据工具链的开发实现及应用维护等;
项目介绍:专注于AI数据处理,为大模型训练提供高质量的多模态数据(文本/图像/音视频等)支持。核心业务包括数据预处理、生成增强、清洗过滤、异常检测、特征提取和质量校验,确保数据精准合规。同时参与训练与推理优化,
4、语音合成:Paddle、TTS
语音克隆:VITS、XTTS
语音识别:Whisper、Funasr
ASR 音频数据采集、清洗、处理、去噪、人声分离、文字转写、标注