职位描述
岗位职责:
一、集群管理体系搭建与优化
制定并持续优化集群资源调度与平衡精细化运营策略,涵盖负载率监控、空闲资源盘活、用户权限分级管理、核时补偿规则制定等,提升资源利用率与使用公平性;
建立健全集群安全管理体系,制定应急响应策略、数据安全与隐私保护规范、权限与访问控制机制,防范安全风险,保障集群运行安全;
统筹集群供应商管理工作,搭建供应商风险管控体系,识别并规避合作风险,优化供应商合作流程与评价体系,提升供应链稳定性。
二、云一体机产品售后服务体系建设
设计并落地故障响应机制,明确不同级别故障的响应时限、处理流程与责任人,确保故障快速响应与闭环;
制定硬件维修与更换规范,明确线上远程排查、返厂维修的适用场景,设定更换阈值(如维修成本超新硬件 30% 时直接更换),提升售后处理效率;
协同商务部与硬件供应商,明确售后责任边界、质保期限、紧急支援机制,建立供应商服务质量定期评估体系,保障售后服务质量与时效。
任职要求:
1. 专业技能
熟悉 Linux 系统、集群调度技术(如 K8s、Slurm 等),具备集群资源管理与优化实战经验;
了解服务器、存储、云一体机等硬件产品特性,掌握硬件故障排查与售后流程相关知识;
具备数据安全、权限管理相关经验,能独立制定安全管控策略与应急方案;
熟悉供应商管理逻辑,具备跨部门、跨企业协同推进工作的能力。
2. 工作经验
3 年以上集群管理或硬件运维相关工作经验,有云产品或硬件设备售后服务体系搭建经验者优先;
具备独立制定技术策略、流程规范的经验,能结合业务需求落地可执行的解决方案;
具备中科曙光、并行科技、新华三、浪潮等企业的集群管理、硬件运维或高性能计算(HPC)相关工作经验者优先考虑。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕