岗位职责:
1、架构设计:负责智算测试与适配优化平台的整体技术架构设计,确保系统能够兼容昇腾 (Ascend 910B) 、百度昆仑芯、阿里PPU等异构芯片架构。
任职要求:
1.主流GPU架构精通:深入理解 GPU/NPU 硬件架构,熟悉通用芯片及国内主流 AI 芯片架构(如昇腾 (Ascend 910B) 、百度昆仑芯、阿里PPU等);
2.底层通信协议: 具备分布式训练或多卡推理场景下的集合通信优化经验,能够分析网络带宽与计算重叠导致的瓶颈;
3.算子管理: 能够指导高性能算子的全生命周期管理,包括算子的版本控制、兼容性管理;
AI模型工程与性能分析
1.主流模型框架:熟练掌握 DeepSeek、Qwen、ChatGLM、Llama等大模型的部署与调试;
2.推理优化工具:深入理解并能集成 vllm-benchmark、Alsbench等自动化基准测试工具;
3.精度与性能平衡:具备性能差距自动化分析能力,能够在保证模型精度的前提下,通过 Profiler 等工具进行全栈性能数据采集与函数调用分析;
4.具备智算中心、AI 开发平台(AIH)或高性能计算相关项目的架构设计经验优先。