职位描述
岗位职责;
1. 高质量数据标注:对文本、图像、语音等多模态数据进行精细化标注,包括但不限于用户意图分类、对话行为识别、多轮上下文关联、跨模态语义对齐、Agent路由决策标签等;
2. 标注规范制定与迭代:参与制定、优化并维护标注指南,确保标注标准清晰、一致且贴合模型训练需求;
3. 数据质量管控:执行交叉校验、一致性检查与异常数据筛查,保障标注数据的高准确率与高覆盖率;
4. 模型反馈闭环:分析模型在训练数据成果上的表现,识别标注盲区或歧义案例,提出数据增强或标注策略改进建议;
5. 跨团队协作:与算法工程师、产品经理紧密配合,理解业务场景与技术目标,确保标注工作精准支撑模型迭代方向;
6. 工具与流程优化:参与标注工具的使用反馈与流程改进,提升标注效率与体验;
7. 众包协作与质控:对接众包团队进行任务拆解、答疑,创建并维护高质量黄金集与标注标准一致性。
任职要求:
1. 本科及以上学历,语言学、心理学、计算机、人工智能、信息管理或相关专业优先;
2. 具备1年以上数据标注、NLP或AI相关项目经验,有对话系统或多模态项目背景者优先;
3. 优秀的逻辑思维与细节敏感度,能准确理解复杂语义与用户意图;
4. 出色的中文语言能力,对语义歧义、上下文依赖、文化语境有敏锐洞察力;
5. 熟练使用办公软件,能快速适应标注平台与协作工具;
6. 责任心强,具备良好的沟通能力和团队协作精神;
7. 能承受一定强度的重复性工作,同时保持高准确率与高产出;
8. 具备基础的数据分析能力,能够产出简明报表与可视化数据洞察。
学历及专业要求:统招本科及以上学历,语言学、心理学、计算机、人工智能、信息管理或相关专业优先;
加分项:
1. 有大模型(LLM)或Agent系统相关数据标注/评估经验;
2. 熟悉Prompt工程、对话策略或意图识别(Intent Detection)基本原理;
3. 具备基础编程能力(如Python)或熟悉SQL,能进行简单数据处理;
4. 了解多模态融合(如图文、AIGC)技术概念;
5. 有标注团队管理、众包管理或质检经验;
6. 熟悉AI伦理、数据隐私及内容安全规范;
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕