2.4-2.8万·14薪
南纬路31号
岗位职责
1. 主导NLP模型全维度测试,针对BERT/GPT等微调模型,覆盖文本生成、实体识别、文本分类等核心任务,设计科学评测方案并验证模型准确率、召回率等关键指标;
2. 专项负责AI提示词测试,设计多场景提示词用例(含歧义性、复杂指令、多轮交互等),验证提示词与模型交互的精准性、鲁棒性及场景适配性;
3. 开展算法大模型性能测试,聚焦推理延迟、吞吐量、资源消耗(CPU/GPU/内存)、高并发稳定性等核心指标,设计压测方案并实施验证;
4. 负责AI系统核心模块及全链路测试,涵盖RAG知识库(知识抽取、向量存储/检索)、生成类功能等,验证模块协同准确性与流程闭环性;
5. 分析测试过程中的模型缺陷、性能瓶颈及提示词适配问题,输出精准测试报告与优化建议,协同开发/算法团队推动问题闭环;
6. 沉淀NLP模型全维度测试、提示词测试及大模型性能测试方法论,构建标准化测试用例库与数据集,提升测试效率与覆盖度。
任职要求
1. 计算机、AI、NLP、数据科学等相关专业本科及以上学历;
2. 熟悉Python+Linux技术栈,具备扎实的测试理论基础与用例设计能力;
3. 深入了解NLP核心技术与Transformer架构,熟悉BERT/GPT等大模型原理及微调、推理流程;
4. 具备AI测试实战经验,熟练掌握NLP模型全维度测试、AI提示词测试及算法大模型性能测试核心方法,能独立完成测试全流程;
5. 熟悉主流性能测试工具(JMeter/Locust等),了解向量数据库(ChromaDB/Milvus)使用与测试方法者优先;
6. 3年以上测试经验,含1年以上AI/NLP或大模型相关测试经验,有全链路测试经验者优先;
7. 具备较强的系统思维、逻辑分析能力及跨团队协作能力,能快速定位复杂测试问题;
8. 加分项:熟悉模型评测指标(F1/BLEU等);具备OCR+NLP多模态测试经验;了解ONNX/TensorRT等推理加速技术;有招投标领域系统测试经验者优先。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕