一、任职资格:
1、专科及以上学历;
2、具备1年及以上主流物理服务器、操作系统交付或者维护经验。
3、熟悉GPU服务器、通算服务器主要部件的基本工作原理,具备服务器日常基础巡检、常见故障的排查能力,能够完成日常基础性维护工作;
4、熟悉Linux操作系统的日常维护、问题排查
5、具备服务器及操作系统相关认证证书人员优先,服务器及操作系统相关认证证书包含:RHCA、RHCE、RHCSA、ACP、VCP、VCAP、MCP、CKA、UCP、KYCP、HCIP-openEuler、NCA-AIIO认证等(英伟达认证助理-AI基础设施与运维)。
二、工作内容:
1、服务器、存储资源、操作系统相关紧急事件遵循相关通知和处理的原则和流程,及时通知相关接口人进行处理;
2、负责定期对机房内服务器、存储、操作系统、中间件等软硬件设备健康状态进行巡检,并完成巡检记录,定期对算力集群计算节点、存储节点等的状态、容量、告警信息等进行巡检;
3、负责服务请求工单处理,根据用户需求负责受理和记录服务请求工单,并参与算力资源的交付,同时负责跟踪处理进度、反馈处理结果、用户电话回访等,保证客户的满意度;
4、做好日常工作交接班管理。