职位详情
AI算力服务器维修工程师
1.5-3万
深圳市芯优博泰智算技术服务有限公司
深圳
3-5年
不限
08-12
工作地址

龙华科兴科学园A701

职位描述
岗位职责:
1. 负责AI算力服务器及机头硬件(含GPU服务器、加速卡、主板、电源、机头组件等)的检测、维修与维护。
2. 熟练使用BGA返修台、示波器、热风枪、X-RAY等设备进行芯片级维修(如GPU/CPU脱焊、显存更换、电路修复等)。
3. 针对英伟达A系列(如A100/A800)和H系列(如H100/H800)显卡进行故障诊断与维修(包括供电电路、信号问题、散热模组等)。
4. 使用PCIE测试卡、万用表等工具对服务器主板、PCIe通道、电源模块进行故障排查。
5. 重点维修服务器机头组件(如技嘉GIGABYTE、超聚变FusionServer等品牌),包括但不限于:
- 机头背板(硬盘/SSD背板)信号与供电故障修复,
- 前面板接口(USB/网口/VGA)电路维修,
- RAID卡、HBA卡故障排查与更换,
- 机头风扇模块、温度传感器异常处理,
- IPMI/BMC模块固件刷写与硬件修复。
6. 撰写维修报告,记录故障现象、分析过程及解决方案,优化维修SOP。
7. 协助团队进行备件管理、维修成本控制及技术培训支持。
任职要求:
1. 芯片级维修
- 操作BGA返修台修复服务器主板/显卡的BGA芯片(如GPU/CPU/PCH芯片)。
- 使用X-RAY检测PCB内部层短路、虚焊等问题,配合热风枪更换微小元器件。
2. 服务器机头专项维修
- 技嘉(GIGABYTE)服务器:熟悉其机头架构(如R系列机架服务器),修复硬盘背板供电异常、前面板控制电路故障。
- 超聚变(FusionServer)服务器:处理机头散热系统告警、BMC通信故障、PCIe插槽信号衰减等问题。
- 其他品牌(如戴尔/浪潮)机头组件的快速诊断与备件更换。
3. 测试与验证
- 使用PCIE测试卡分析链路训练失败、带宽不足等PCIe相关故障。
- 对维修后的机头组件进行烧机测试、温度及信号完整性验证。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请