职位描述
职位概述
我们正在寻找一位兼具测试开发与运维思维的工程师。您不仅是产品质量的守护者,更是确保我们复杂的AI服务能够稳定、高效交付和运行的关键人物。您将深度参与我们核心AI产品的测试策略制定、自动化框架搭建与生产环境的稳定性保障工作。这个职位要求您对AI技术有深刻的理解,并对打造世界级的产品体验充满热情。
核心职责
1. AI产品测试与质量保障 (70%)
负责公司大模型及相关AI应用(如Agent、API服务、Web应用)的全流程质量保障,包括功能、性能、安全、稳定性测试。
设计与执行针对大模型特性的专项测试方案,如:幻觉测试、上下文长度测试、提示词对抗性测试、多轮对话一致性测试、输出稳定性测试等。
开发、维护并优化先进的自动化测试框架和脚本(包括端到端E2E、集成、API测试),并将其集成至CI/CD流程。
与算法工程师和产品经理紧密协作,深入理解模型能力与产品需求,定义可量化的验收标准和质量指标。
对线上问题进行分析和追踪,推动问题闭环,并转化为有效的测试用例。
2. 运维与部署支持 (30%)
使用Docker容器化技术,打包和部署AI模型及应用程序。
使用Kubernetes管理生产、预发环境的服务编排、扩缩容与发布流程。
监控系统运行状态(如GPU资源利用率、API延迟、错误率),参与排查和解决线上基础设施及环境相关问题。
编写和维护运维文档、部署手册,实现运维工作的自动化和标准化。
任职要求 (Must-Have)
学历与经验: 计算机科学或相关专业本科及以上学历,具备2年以上测试开发经验,有AI产品(特别是大模型、NLP相关方向)测试经验者优先。
技术能力:
熟悉大语言模型(LLM)的基本原理、应用场景及常见工具(如LangChain、LlamaIndex等),具备使用主流API(如OpenAI、Claude或开源模型)进行测试和开发的能力。
精通Linux操作系统,能熟练使用命令行工具进行日志排查、性能分析和问题定位。
熟悉容器化技术,如Docker,了解容器编排工具Kubernetes的基本概念和操作。
具备扎实的编程能力,熟练掌握至少一种编程语言(Python为强烈优先),用于自动化脚本和测试工具开发。
综合素质:
具备出色的分析问题和解决问题的能力,对技术有强烈的好奇心和求知欲。
具备优秀的沟通能力和团队协作精神,工作积极主动,有责任心。
具备良好的抗压能力,能适应快节奏的创业公司环境。
优先考虑 (Nice-to-Have)
有构建或维护大规模、高可用分布式系统测试环境的经验。
熟悉主流的CI/CD工具链(如Jenkins, GitLab CI)。
熟悉监控报警工具(如Prometheus, Grafana)。
对MLOps有基本了解。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕