「天津河西区数据标注/AI训练师（base北京）招聘」

职位详情

数据标注/AI训练师（base北京）

8000-9000元

润和软件

天津

1-3年

大专

08-04

工作地址

阿里路

职位描述

岗位一
1、负责大模型训练数据的评测，包括但不限于文本、图像、多模态数据等；
2、根据标注规范对数据进行精准标注，确保数据质量符合模型训练要求；
3、对标注数据进行质量检查，识别并修正错误，将其改写成优质数据；
4、参与标注规则的制定与优化，持续提升标注效率和一致性；
5、作为指导员带教外部众包标注。
职位要求
1、专科及以上学历，语言学、文学、哲学、历史学、新闻学等专业优先；
2、有至少1年及以上大模型评测、或搜索内容评测经验，对数据敏感（有SFT阶段数据标注经验优先）；
3、自我管理意识强，态度端正，细心负责；
4、学习能力强，有较强的执行能力和责任感，能接受繁琐重复的工作

岗位二
1、本科及以上，语言学、心理学、新闻传播、播音主持、语文教育等文科专业，英语通过CET-4/CET-6优先；
2、1年及以上大模型问答类文本改写经验，对文字保持敏感度，准确识别优质对话内容；同时兼具良好的写作能力，拥有文本编辑/改写/评测经验，能够对瑕疵内容进行有效优化；
3、参加过PromptEngineering或半自动标注生产的项目，掌握PE能力；
4、高度总结归类同类型内容，对抽象概念作出灵活、通俗化阐释；有较强的学习能力、逻辑能力强、细心，能够处理复杂的对话场景；
5、对汉语言相关知识有一定了解，了解汉语拼音、韵律等语言知识并能在工作中进行相应的应用；有对话数据采集和语言文本类大模型项目经验者优先。
1、负责大模型相关语料和数据的撰写与评估等工作，支持项目经理和产研团队定义数据评测和标注环节的理想态；
2、承接业务与项目经理要求，结合PE工程、平台工具等方式提升数据交付的质量和效率，并沉淀方法文档；
3、深刻理解数据交付的需求，负责数据质量把控，梳理并分析数据质量的问题，并对市场上相关数据进行行业调研并输出分析报告；
4、运用基本的数据分析方法和工具，对训练数据进行统计和分析，提供有效的数据结论、数据支持和优化建议。

岗位三
1、本科及以上学历、语音学、汉语言相关专业、计算语言学、英语好；
2、参加过PromptEngineering或半自动标注生产的项目，掌握PE能力优先；3、有1年以上大语音模型任务评测或标注的经验，有语义学、语用学、语音或者音系研究经验者优先；
3、有TTS正则化、拼音标注、AI播客等任意经验，TTS优质产品经验优先，了解语音算法及模型训练原理优先；
1、按项目标准完成语音/文本数据标注、评测，通过全流程操作保障数据高效产出与质量达标；
2、自然对话音频剪辑转写文本校对、拼音标注、模型评测、发音效果评测（语音准确性、停顿、拟人、情感等）、产品巡检问题反馈、具有一定音色审美能力
3、及时沟通工作异常案例并跟进解决，主动发现流程痛点。
4、负责大模型相关语料和数据的撰写与评估等工作，支持项目经理和产研团队定义数据评测和标注环节的理想态；
5、承接业务与项目经理要求，结合PE工程、平台工具等方式提升数据交付的质量和效率，并沉淀方法文档；
6、深刻理解数据交付的需求，负责数据质量把控，梳理并分析数据质量的问题，并对市场上相关数据进行行业调研并输出分析报告；
7、运用基本的数据分析方法和工具，对训练数据进行统计和分析，提供有效的数据结论、数据支持和优化建议。

以担保或任何理由索取财物，扣押证照，均涉嫌违法，请提高警惕