职位详情
AI大模型数据标注-北京
7000-10000元
深圳市华成峰科技有限公司
天津
1-3年
本科
12-26
工作地址

腾讯公司1

职位描述
注:此岗位是招聘到北京

岗位要求:1.学历与经验: 本科及以上学历。具备1-3年数据标注、质量评测、内容审核或相关领域经验;行业背景不限(互联网、咨询、传统行业相关评测经验均可)。对AIGC相关产品,例如豆包、可灵、GPT-4O、Midjourney、Stable Diffusion等 一种或几种有较深度使用经验,对于图生文/文生图/文生视频技术特点和能力边界有较深刻的认识。有训练lora或者使用comfyui经历的可加分。
2.逻辑思维: 具备清晰的逻辑判断能力,能够识破复杂的文字逻辑陷阱,对内容的一致性和合理性有较强的辨识度。
3.主观感知力(高情商表现): 具备优秀的语义感知力,不仅能判断对错,还能感知回复内容的“质感”,对主观体验的好坏有敏锐且准确的判断。
4.反馈沟通: 表达清晰客观,能够准确描述评测中遇到的标准争议,并及反馈,确保信息传递无误。
5.工作态度: 细心稳重,能够接受重复性的评测工作,并能在稳定的节奏下保持专注与高效。
6.加分项(满足基础条件前提下):
a.领域背景: 具备代码、医疗、金融、命理星象中任一专业知识背景者优先;
b.大模型经验: 有过大模型(LLM)或图生文(VLM)相关标注经历。
c.多模态经验: 具有文生图(Text-to-Image)或文生视频(Text-to-Video)相关评测/打分经验者优先

岗位职责:
1.模型输出打分: 负责VLM(视觉语言模型)图生文结果的质量评估,针对逻辑准确性、事实一致性、是否存在幻觉等维度进行精准打分判定。
2.评测集构造: 协助业务方构建多模态评测题目,包括搜集/筛选特定场景图片,并根据业务需求编写高质量、有区分度的Prompt(提示词)。
3.逻辑与理解把关: 在评测过程中,能够准确识别模型在逻辑推理与内容理解方面的表现,捕捉回复中细微的逻辑漏洞或语义偏差。
4.主观体验把关: 站在用户视角,对模型回复的整体质量进行“主观好坏”评判。包括回复是否自然、是否契合语境、以及表达是否符合人类的使用习惯与审美。
5.问题汇总与反馈: 收集并整理评测过程中出现的典型错误案例(Badcase),清晰记录并向内部负责人反馈,协助业务侧汇总优化策略(无需对接研发人员)。
6.标准执行与对齐: 快速学习并严格执行评测标准(SOP),确保在持续的任务产出中保持评分的一致性与严谨性。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请