工作内容:
1. 针对生产问题或测试语料,生成测评数据及报告;
2. 对模型生成的文本内容进行多维度分析,分析模型回复的合理性,确保评估准确性,提升搜索相关性。
3. 泛化大模型测试语料,全面评估大模型泛化能力
4. 模型安全性测试,进行安全评估,识别潜在风险,确保上线前达到预定安全标准。
岗位要求:
1、统招本科及以上学历,计算机相关专业,2024年6月毕业之前的可以投递;
2、 了解大模型深度思考与方法;
3、熟悉Pycharm、Postmans等工具的使用;熟练掌握SQL、Excel等数据处理工具;熟练使用deepseek;
4、具有良好的沟通能力和逻辑思维能力;