职位描述
岗位职责:
1. 针对生产问题或测试语料,生成测评数据及报告;
2. 对模型生成的文本内容进行多维度分析,分析模型回复的合理性,确保评估准确性,提升搜索相关性。
3. 泛化大模型测试语料,全面评估大模型泛化能力
4. 模型安全性测试,进行安全评估,识别潜在风险,确保上线前达到预定安全标准。
岗位要求:
1、统招一本及以上学历,优先双一流学历;
2、 了解大模型深度思考与方法;
3、熟悉Pycharm、Postmans等工具的使用;熟练掌握SQL、Excel等数据处理工具;4、具有良好的沟通能力和逻辑思维能力;
5、有模型标注、搜索评测、数据质检经验者优先;
6、对AI技术有热情,适应快节奏、重复性工作;
7、做过需求分析设计、也有一定脚本经验
8、接受加班。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕