【岗位职责】
1. 评测标准迭代与标注: 协同算法与运营团队,负责LLM英文数据的标注与评分工作,参与制定LLM英文评测标准
2. 高难度评测数据构建: 面向真实应用场景,通过prompt engineering等方式生产高质量、高难度的英文评测数据,识别并分析头部模型的能力短板。
3. 翻译及支持: 负责评测数据的中英翻译,并完成团队指定的其他临时任务。
【岗位要求】
1. 基础:优秀院校本科及以上,逻辑思维能力强
2. 基础:英文能力突出,达到英文专八或雅思7.0或同等能力
3. 基础:有良好的理解与需求分析能力,能够分析理解评测数据的核心需求
4. 必须:要求具备至少1年AI相关行业经验,大模型相关训练或评测数据标注经验优先
5. 必须:日常生活中有丰富的LLM使用经验,熟悉头部模型的优缺点
6. 加分:对AI行业有个人见解,并有明确的个人职业发展规划。
7. 加分:有丰富的prompt撰写经验