职位描述
鹅厂外包岗位,有免费班车,需现场笔试(100+HC)
多个方向标注岗位:文学,AI语音,意图,搜索问答,智能客服,法律,公文,英文8级,文学垂类(儿童文学,编剧,小说等)
【AI搜索】:熟悉AI搜索场景,逻辑性强,能系统性评估模型COT推理过程,掌握基础信源验证方法,快速核查模型引用的文献、数据、案例等信息来源。有搜索引擎质量评估经验,或对grok/gpt/perplexity等产品的deepsearch功能有深刻了解。有电商行业经验,熟悉各垂类商品(如3C、美妆等),或熟悉泛娱乐领域,对游戏/影视/音乐/书籍/体育等不同兴趣圈有较多了解者优先。
岗位要求:
1.学历与经验: 本科及以上学历。具备1-3年数据标注、质量评测、内容审核或相关领域经验;行业背景不限(互联网、咨询、传统行业相关评测经验均可)。对AIGC相关产品,例如豆包、可灵、GPT-4O、Midjourney、Stable Diffusion等 一种或几种有较深度使用经验,对于图生文/文生图/文生视频技术特点和能力边界有较深刻的认识。有训练lora或者使用comfyui经历的可加分。
2.逻辑思维: 具备清晰的逻辑判断能力,能够识破复杂的文字逻辑陷阱,对内容的一致性和合理性有较强的辨识度。
3.主观感知力(高情商表现): 具备优秀的语义感知力,不仅能判断对错,还能感知回复内容的“质感”,对主观体验的好坏有敏锐且准确的判断。
4.反馈沟通: 表达清晰客观,能够准确描述评测中遇到的标准争议,并及反馈,确保信息传递无误。
5.工作态度: 细心稳重,能够接受重复性的评测工作,并能在稳定的节奏下保持专注与高效。
6.加分项(满足基础条件前提下):
a.领域背景: 具备代码、医疗、金融、命理星象中任一专业知识背景者优先;
b.大模型经验: 有过大模型(LLM)或图生文(VLM)相关标注经历。
c.多模态经验: 具有文生图(Text-to-Image)或文生视频(Text-to-Video)相关评测/打分经验者优先;
岗位职责:
1.模型输出打分: 负责VLM(视觉语言模型)图生文结果的质量评估,针对逻辑准确性、事实一致性、是否存在幻觉等维度进行精准打分判定。
2.评测集构造: 协助业务方构建多模态评测题目,包括搜集/筛选特定场景图片,并根据业务需求编写高质量、有区分度的Prompt(提示词)。
3.逻辑与理解把关: 在评测过程中,能够准确识别模型在逻辑推理与内容理解方面的表现,捕捉回复中细微的逻辑漏洞或语义偏差。
4.主观体验把关: 站在用户视角,对模型回复的整体质量进行“主观好坏”评判。包括回复是否自然、是否契合语境、以及表达是否符合人类的使用习惯与审美。
5.问题汇总与反馈: 收集并整理评测过程中出现的典型错误案例(Badcase),清晰记录并向内部负责人反馈,协助业务侧汇总优化策略(无需对接研发人员)。
6.标准执行与对齐: 快速学习并严格执行评测标准(SOP),确保在持续的任务产出中保持评分的一致性与严谨性。
PS:还有其他领域的标注评测岗位,大量招人,
搜索问答:意图识别/AI对话问答/智能客服/优化提示词(prompts)关键词
语音/元方/特色业务
文学创作:例如有比较丰富的小说、剧本、文案创作的经验;对文字敏感;也有AI工具的使用及效果调整的经验或小说和故事类的文字润色有丰富经验或做过标注和训练任务的工作匹配的背景:
例如:科大讯飞/番茄小说/字节/百川/百度/小红书/网易/豆包等公司有长文标注经验或文案创作或编辑或小说创作或AI创作改写扩写/打分标注或公文撰写加分项:对于目前主流的AI产品/大模型工具(各大模型(豆包,文心,元宝,讯飞,天宫A1,kimi等)使用较多对各AI产品文本生成能力有自己的理解
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕