岗位职责:
1. 基础数据与测试集构建
数据采集与标注:负责测试集数据的采集、清洗、校对和分类整理,为AI模型(如OCR、NLP模型)优化提供数据支持。
2. 测试执行与问题记录
功能与性能测试:依据测试计划,对搭建的智能体、AI应用、机器人执行功能测试(交互响应、任务准确性)、性能测试(响应时间、吞吐量)及稳定性测试。
3. 效果评价:评测AI产品的质量(如机器人稳定性、任务成功率、识别准确率等任务),做好质量评测。
任职要求:
1.教育背景:本科或硕士在读,计算机科学、人工智能、软件工程、数学、电子信息等相关专业优先。
2.编程能力:
熟悉至少一种编程语言(Python为主,或Java/JavaScript),能够阅读和理解代码逻辑。
3.有基础的脚本编写能力,能够处理数据或搭建简单测试脚本。
4.AI基础知识:
对机器人、人工智能、机器学习、深度学习有浓厚兴趣,了解大模型、NLP/CV等基本概念。
5.了解主流大模型评测基准(如MMLU、MT-Bench、TruthfulQA等)者优先。
6.工具使用:了解Postman/JMeter等接口测试工具,或Selenium/Pytest等自动化测试框架者优先。