职位描述
岗位职责:
1. 负责大模型测评数据的整理、分类、结构化标注。
2. 根据测评和测试方案,执行模型效果测评和系统端对端测试。
3. 记录测试异常并复现用户问题场景,分析定位问题。
4. 统计分析用户真实数据,不断完善用例库。
5. 测评系统建设支持。
岗位要求:
1. 计算机相关专业本科及以上学历,经验年限不限。
2. 能快速理解NLP任务需求,有AI辅助编程工具或类似产品的使用或测试经验。
3. 熟练使用Excel/Python进行基础数据处理,具备一定的编写测试脚本能力。
4. 熟悉常用的测试开发工具,如Git、Postman、Jmeter等。
5. 具备良好的沟通能力、执行力强、具备跨团队协作意识和问题解决能力。
6. 加分项:NLP基本知识和原理,模型测评经验,prompt工程能力。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕