职位详情
系统优化专家
3.5-5万
浪潮集团
北京
不限
硕士
06-09
工作地址

通州紫光科技园

职位描述
岗位职责:
1、优化 CPU 调度策略,针对 AI 训练 / 推理场景,优化 x86/ARM 处理器与 AI 加速卡的通信效率;优化 NVMe SSD、RAID 阵列的 I/O 性能,设计网络协议栈及负载均衡策略;调优 GPU/TPU 资源分配,优化模型推理框架性能;
2、优化硬件初始化流程,开发或适配工业软件驱动,调整 Linux 内核参数,优化 Docker/Kubernetes 资源调度,确保 AI 训练任务与工业软件在容器化环境下的性能隔离与共享;
3、设计压力测试方案,验证系统在极端场景下的鲁棒性;优化散热与电源管理,降低硬件故障率;
4、与系统设计 SE 协作,优化硬件架构以适配软件需求,支持测试验证团队制定测试标准,配合售前团队完成客户 PoC 测试,输出性能白皮书及优化方案。
任职要求:
1、硕士及以上学历,计算机科学、电子工程、人工智能或相关专业;
2、10 年以上高性能计算、服务器或 AI 设备系统优化经验,5 年以上服务器 / 存储 / 网络 / AI 多领域交叉优化经验;
3、主导过至少 3 款高性能计算产品的系统优化项目,有人工智能一体机或工业设计一体机调优经验者优先;
4、精通 x86/ARM 架构、NUMA 技术、IPMI 远程管理,熟悉 NVMe 协议、RAID 技术、存储虚拟化,掌握 TCP/IP 协议栈、SDN 技术、10G/25G 以太网调试,熟悉AI主流大模型、PyTorch框架、模型压缩与推理加速技术;熟练使用 perf、oprofile、nmon、Wireshark 等工具,精通 C/C++、Python,具备 Linux 内核模块开发或 Shell 脚本自动化能力,掌握 ANSYS 热仿真、HPL/HPCG 基准测试工具;
5、对服务器、存储、网络及 AI 技术的交叉融合有深刻理解,能快速定位复杂系统瓶颈;逻辑严谨,具备 “从芯片到应用” 的全链路问题分析能力;出色的跨团队协作能力,擅长与硬件、软件、测试团队高效沟通。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请