职位详情
大模型数据
8000-10000元
北京合正未来科技有限公司
北京
1-3年
大专
01-08
工作地址

滴滴公司湾流.

职位描述
岗位职责
本岗位的核心目标是通过对大模型生成的思维链进行精细化的质量评估与打分,构建高质量、高一致性的标注数据集,从而直接助力大模型在推理能力方面的优化与迭代。
质量评估与打分:负责对大模型输出的各类思维链(COT)进行多维度质量评估与精准打分,重点聚焦于逻辑连贯性、推理正确性、步骤完整性以及解决问题的有效性​
标准制定与迭代:深入理解业务场景,参与制定并不断优化思维链标注的质量标准和详细规范(例如,针对超类人思维COT、工具调用COT等不同场景)
数据交付与反馈:严格按照标注规范操作,确保数据质量与一致性,按时交付高质量的标注数据集。能主动总结标注过程中的共性问题和模型短板,形成报告并反馈给算法团队,为模型优化提供方向
协同与优化:与算法研究员、RLHF工程师等团队成员紧密协作,通过高质量的标注数据助力模型完成冷启动,并在与环境的交互中取得更好的强化学习效果
任职要求
我们寻找的是对细节有极致追求、对逻辑推理有浓厚兴趣的候选人。
必备条件
教育与经验:大专及以上学历,专业不限。有数据标注、特别是大模型相关(如SFT、Pair数据)标注经验者优先
核心技能: 出色的逻辑思维能力:能够快速理解复杂问题的推理脉络,精准识别逻辑漏洞或推理偏差。 极强的专注力与耐心:对重复性的精细工作有耐性,能够保持长时间的高质量标注输出。 严谨细致:注重细节,对数据质量有高标准要求。 技术理解:对大型语言模型(LLM)的基本原理有概念性了解,熟悉监督微调(SFT)、思维链(Chain-of-Thought)等技术概念者更佳
加分项 具备一定的Python脚本编写能力,能通过简单工具提升标注或数据分析效率
在数理逻辑、代码编程、Agent任务等特定领域有扎实的知识基础
具备良好的沟通能力,能够清晰描述和反馈问题。 职位亮点 前沿价值:您的工作是提升大模型推理能力的核心环节之一,直接参与最前沿的AI研发过程。 能力成长:深度接触大模型的各种推理模式,极大利于培养严谨的逻辑思维和对AI能力的深刻洞察。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请