职位描述
岗位名称:AI测试专家(大语言模型/生成式AI方向)
核心职责
测试体系构建:主导AI应用全生命周期质量保障,设计功能/性能/安全测试方案,建立覆盖意图识别(准确率≥95%)、多轮对话连贯性(≥90%)等核心指标的评估体系,推动传统测试与AI融合。
全维度测试执行:开展对抗样本测试、长尾意图覆盖等专项验证,开发自动化测试框架(Python/Go)并集成至CI/CD流程,实现测试用例持续回归;针对RAG系统优化知识库时效性验证方法,通过数据增强提升模型鲁棒性。
技术攻坚与创新:探索LLM测试前沿技术(如AI生成测试用例、强化学习优化提示词),搭建多模态生成内容质量评估框架,输出《AI测试标准手册》等工具网页。
任职要求
1、基础能力:本科以上学历,3年以上AI测试经验,熟悉Transformer架构及Prompt Engineering原理,掌握Python/Java编程。
2、技术栈:精通Dify/LangChain等AI开发工具,具备LangChain测试框架使用经验,熟悉TensorFlow/PyTorch模型推理优化。
3、业务理解:能独立设计多轮对话测试场景,通过日志分析定位模型幻觉、知识库过时等bad case,推动开发/数据团队闭环优化。
4、质量思维:主导构建AI应用质量风险评估模型,输出《上线风险评估报告》,对冷启动效果波动等场景提出预案。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕