【岗位职责】
1、系统架构定义: 主导AI服务器(8-GPU/16-GPU模组)的整机系统架构设计。定义CPU-GPU互连拓扑(NVLink/PCIe Switch架构)、内存子系统及I/O扩展方案,解决“Memory Wall”和“IO Wall”瓶颈。
2、关键技术路径决策: 针对SXM/OAM级别的高功耗设备(>10kW/Rack),决策散热技术路径(风冷 vs DLC冷板式液冷 vs 浸没式),平衡PUE、算力密度与部署成本。
3、高速互连与供电架构: 制定112G/224G SerDes链路的总体损耗预算(Loss Budget),定义电源分配网络(PDN)架构以应对GPU极高的瞬态电流(di/dt)。
4、跨部门技术统筹: 拉通EE、SI/PI、热设计、结构及BIOS/BMC团队,解决系
统级耦合问题(如SI与散热的物理冲突),并在关键器件选型(CPU/Switch/NIC)上拥有一票否决权。
5、前瞻性研究: 跟踪下一代技术标准(PCIe Gen6/7, CXL 2.0/3.0, OCP OAM规范),规划产品技术演进路线。
【任职要求】
1、经验门槛: 10年以上服务器研发经验,至少5年系统架构经验。必须有4路/8路以上高端服务器或HPC集群架构设计成功案例。有超节点产品设计经验加分。
2、核心技术:
精通x86 (Intel Xeon/AMD EPYC) 及 NVIDIA GPU系统架构。
深刻理解高速总线协议(PCIe Gen5, CXL, NVLink, InfiniBand)。
对数据中心基础设施(配电、液冷CDU、机柜标准)有宏观认知。
3、思维能力: 具备极强的系统工程思维(System Engineering),能在成本、性能、可靠性、可制造性之间做极其复杂的权衡(Trade-off)。