职位描述
岗位职责
- 制定GPU硬件/驱动全生命周期测试方案,主导功能、性能及稳定性测试,完成故障根因分析并推动优化方案落地
- 开发自动化测试框架及工具链,覆盖白盒/黑盒测试场景,提升测试效率(Python/Shell脚本开发能力)
- 针对算力、显存带宽、流处理器负载等核心指标设计专项测试,输出性能瓶颈优化建议
- 搭建HPC测试环境,完成Linux内核调试、驱动部署及PCIe/NVLink等高速接口协议验证
- 主导图形API(OpenGL/Vulkan/DirectX)兼容性测试与异构计算场景验证
技能要求
- 熟悉GPU架构原理,掌握核心频率/功耗/显存管理等关键参数测试方法
- 熟练使用DCGM、Nsight等工具链完成性能分析与故障诊断
- 具备自动化测试框架开发经验,熟悉I2C/MCTP硬件通信协议
- 3年以上GPU或高性能计算设备测试经验,本科及以上学历(电子工程/计算机相关专业)
- 掌握DPU/智能网卡等异构设备联合测试方案
- 具备嵌入式系统及Linux内核模块调试经验
加分项
- 熟悉CUDA/OpenCL并行计算生态,有AI模型训练推理场景调优经验
- 熟悉芯片级测试流程(CP/FT测试程式开发经验优先)
- 持有NVIDIA/AMD等厂商认证工程师资质
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕