岗位要求:
专业倾向文科类:英语语言文学、新闻传播学、汉语语言学等方向优先
理工类:计算机科学、电子信息工程等方向优先
工作内容:
纯文本评测,分析竞对及内部模型,对模型输出内容打分、排序;(会SFT改写及PE调优可以加分)
工作经验与核心能力:
具备1年以上LLM文本数据评测经验,包括:
1、设计并执行多维度模型评测方案(排序/打分)
2、构建科学评估指标体系及数据分析框架
3、定位模型缺陷案例(BadCase),推动效果优化闭环
4、掌握Benchmark数据集构建方法论
5、知识储备丰富,涉猎较广泛,学习能力强,使用过大模型产品(千问/豆包/DeepSeek/kimi)者优先
6、精准识别生成内容的无害性、事实准确性及信息价值
7、具备大规模文本处理能力(日均万字符级审阅)
工作时间:早九晚六周末双休法定休
薪资:10000-13000面试定薪