1.2-1.5万·13薪
北科大厦
岗位职责:
1. 测试方案设计与用例编写,参与AI产品需求评审,基于大模型交互设计测试点,编写覆盖Prompt、API、Agent工作流等的功能性测试用例;
2. 模型输出质量评估,使用自动化评估工具(如 OpenCompass / RAG-eval / PromptBench)对模型输出质量、稳定性进行测试,定期进行 Top-1 命中率、一致性、幻觉率等指标分析;
3. 多模态输入/输出测试,设计图文、音频、PDF、知识库等多模态输入的边界测试, 检测图生文、图问答、视频摘要等多类型 Agent 的响应准确性;
4. 回归测试与线上巡检,建立测试集与对比集,对模型更新、Prompt变更进行差异分析,联合产品与交付团队建立测试基准、回归报告、QA流程文档;
5. 辅助构建测试平台,协助搭建自动化测试脚本(Python)、日志分析与异常定位模块, 建议模型fallback机制与降级策略,以提升鲁棒性。
任职要求:
1. 本科及以上学历,计算机、人工智能、软件工程相关专业;
2. 至少1年以上测试相关经验,有AI/数据产品/大模型应用测试经验优先;
3. 熟悉至少一种测试工具/框架,如 Postman、pytest、JMeter、Selenium、Pandas 等;
4. 了解大模型API(如OpenAI、Qwen、Gemini)、RAG系统或Prompt结构优先;
5. 有较强的问题定位与复现能力,沟通协作意识强,逻辑清晰;
6. 熟悉版本管理工具(如 Git),理解测试流程与文档标准;
加分项:
1.有 AIGC 产品测试经验,如对图生文、知识问答、智能体流程有测评经验;
2.会 Python 脚本开发,可独立编写测试逻辑或调用模型接口;
3.有参与过 LangChain / LangGraph / RAG 项目测试工作;
4.熟悉大模型测试指标(BLEU、ROUGE、Hallucination Rate、F1、Embedding recall);
5.英文能力良好者可参与英文Prompt测试、国际API文档评审;
工作地点:
前期:青岛市城阳区铁骑山路413号
后期:广东省深圳市南山区北科大厦501房
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕