职位描述
【工作职责】
1、参与多模态基础模型的音频数据预处理和脚本开发,执行既定的数据处理流程,确保数据按时交付并满足业务需求。
2、熟悉常用的音频数据格式,了解音频数据的基本属性,了解音频数据处理工具,能够对不同来源的音视频数据做格一化处理。
3、负责日常数据配置文件的格式适配,脚本开发,确保上下游数据流可以正常运行。
4、有数据生产工具代码优化经验者优先,主要职责包括工具链效能提升,有昇腾实践经验优先。
5、有语音相关的模型应用经验者优先,负责语音后训练数据合成,包括但不限于语音识别、语音合成、语音翻译、语音情感识别、说话人识别、声音事件检测、音乐风格识别。
6、有语音大模型评测经验者优先,负责S2T,T2S,S2S的语音理解能力和语音交互能力评测,有大模型推理经验优先。
【任职要求】
1、计算机科学、软件工程、人工智能等相关专业本科及以上学历,具备 2 年以上相关经验者优先。
2、熟练掌握Linux环境,具备Shell脚本编写能力,了解开发环境部署与调试。
3、具备扎实的编程基础,熟练掌握Python,熟悉Linux基本操作。
4、要求具有较强的团队协作意识,有过数据版本管理经验者优先。
5、对大型语言模型(LLM)有一定了解者加分。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕