运维经理(基础设施)
2.5-3万
北京 本科
金唐西联大厦
职位名称:AIDC IT值班运维工程师主管
职位摘要:我们正在寻找一位有才华的AIDC SRE 7*24值班主管加入我们的团队,负责7*24轮班维护和改进我们AI 数据中心的基础设施。您将负责确保支持我们的 AI 应用程序的系统的可靠性、可扩展性和性能。
主要责任:
•带领现场值班团队处理各种7*24支持中的主机,网络,存储等设备的问题,通过巡检和监控来管理和维护软硬件基础设施的健康和性能;
• 设计和实施解决方案以提高硬软件系统的可靠性、可扩展性和性能。
• 与网络,存储工程师及其他SRE 密切合作,排除和解决AIDC相关的问题。
• 与各供应商沟通合作,确保提供最佳解决方案来满足我们的值班需求。
• 安排并参与值班轮换,为AIDC基础设施提供全天候(24/7)支持。
资格:
• 计算机、电气、电子等相关领域的统招专科及以上学位。
• 3 年以上担任IDC SRE 或相关角色的经验。
• 具有IDC硬件,操作系统及应用测试、运维和故障排除方面的经验。
• 了解数据中心架构,包括服务器、存储、网络和电源系统。
• 熟悉Linux服务器管理。
• 强大的分析和解决问题的能力。
• 出色的沟通和团队合作能力。
优先资格:
• 具有智算硬件(例如 GPU, IB交换机)的经验优先。
• 熟悉脚本语言优先,例如Python 或Bash。
• 熟悉数据中心冷却和通风系统知识优先。
• 善于使用AI工具辅助完成工作的优先。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕