职位详情
大模型性能测试
1.4-1.5万
中电金信软件有限公司
上海
1-3年
本科
08-12
工作地址

百度上海研发中心百度

职位描述
岗位职责:
1、设计并执行大模型在多种硬件平台(如 NVIDIA GPU等)上的性能测试方案,涵盖训练与推理阶段;
2、构建并维护模型性能 Benchmark 体系,覆盖吞吐量、延迟、显存占用、功耗等关键指标;
3、利用 profiling 工具(如 Nsight、PyTorch Profiler、MindSpore Profiler)定位性能瓶颈,输出可复现的测试报告
任职要求:
技术经验:
熟悉 GPU 编程(CUDA、ROCm)或至少一种国产 AI 芯片(如 Ascend、MLU)的开发与调优流程;
熟悉常见大模型结构(如 LLaMA、Qwen、DeepSeek、ChatGLM 等)及其训练/推理流程;
熟练掌握 PyTorch、DeepSpeed、Megatron-LM、vLLM 等训练/推理框架中的一种或多种;
熟悉性能调优工具链,如 Nsight Systems、TensorBoard、Perfetto、Roofline 分析等;
编程能力:精通 Python,具备 C++/CUDA 开发能力者优先;
加分项:
有 MLPerf、LM-Harness 等 Benchmark 经验;
参与过大模型在国产芯片上的迁移落地项目;
熟悉低精度训练(FP8、INT8)、KV-Cache 优化、投机解码、通信压缩等推理优化技术
学历背景:计算机、电子工程、人工智能等相关专业

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请