工作职责:
1、硬件维护;负责服务器、网络设备(交换机/路由器)、存储设备及UPS等硬件的安装、调试、升级与更换。定期巡检硬件状态(如硬盘健康度、电源冗余),记录设备生命周期,及时淘汰老旧设备。
2、环境监控;实时监测机房温湿度、电力供应(市电/发电机)、消防系统、空调运行状态,管理机柜空间与电力分配,避免过载,优化散热效率(如冷热通道隔离)。
3、监控与告警;监控服务器CPU/内存/磁盘使用率、网络流量及服务端口状态。设置阈值告警,对异常流量(如DDoS攻击)或资源瓶颈(如磁盘满)快速响应。
4、故障处理7×24小时响应故障,按SLA分级处理(如P0级故障需15分钟内介入)。实施高可用(HA)方案,如负载均衡、双机热备,降低业务中断风险。
5、备份与容灾;制定备份策略(全量/增量备份),验证备份可恢复性,定期演练容灾切换。
6、物理安全;管理门禁系统、视频监控,限制非授权人员进入,登记设备进出记录。防范物理威胁(如漏水、火灾),定期测试消防设施。
7、访问控制;配置防火墙策略、VPN权限,管理服务器SSH密钥,遵循最小权限原则。定期审计账户权限,清理离职人员访问权限。
8、文档管理;维护机房拓扑图、设备资产清单、IP地址规划表及操作手册(如标准故障处理流程)。
9、编写事故报告(Post-mortem),分析根因并制定改进措施。
10、优化资源利用率(如虚拟化整合闲置服务器),降低PUE(能源使用效率)指标。
岗位要求:
一、学历要求
1.本科及以上学历。
2.计算机相关专业:计算机科学、信息技术、通信、自动化、电子信息、电气工程、信息管理等相关专业。
二、技能要求
1.熟悉操作系统:熟悉Linux、Windows等常用操作系统的基本原理和操作,能够熟练进行系统的安装、配置、维护和管理。
2.网络设备配置和管理:对网络设备的配置和管理需有一定了解,包括路由器、交换机等,以确保网络环境的稳定和高效。
3.应用服务部署和优化:熟悉常用应用服务(如Nginx、Php、MySQL、Redis、Apache等)的部署、配置和优化,能够解决应用服务中的常见问题。
4.弱电机房设备了解:对弱电机房设备(如UPS电源、精密空调等)有一定了解,确保机房环境的稳定运行。
5.技术文档编写:具有良好的脚本和文档编写能力,能够清晰、准确地记录运维过程中的操作和问题解决方案。
6.相关技术了解:对相关技术(如云计算、虚拟化、大数据等)有一定了解,能够跟上技术发展的步伐。
三、工作经验要求
1.机房工作经验:有机房运维工作经验者优先考虑,熟悉机房设备上下架、日常设备重启、系统重装、硬件更换、布线施工等操作。
2.系统集成工作经验:有系统集成相关工作背景,熟悉X86服务器、IBM小型机以及Linux、ESXI、Windows、AIX系统安装、基本配置、双机配置等系统集成相关工作。
四、个人素质要求
1.责任心和担当:有责任心,有担当,能够适应7x24小时值班工作,确保机房设备的稳定运行。(家在唐山本地或长期定居者优先考虑)
2.沟通和团队协作能力:有良好的服务意识、沟通能力及团队精神,能够与团队成员、其他部门以及外部合作伙伴进行有效沟通,共同解决问题。
3.学习能力和适应能力:勤恳好学,工作严谨,能够适应不断变化的运维环境和需求。
五、其他要求:(加分项):
认证证书:有网络工程师或HCIP、RHCE、OCP等同等级资格证书者优先考虑。
电工证:具备电工证及操作证优先考虑。
软件开发:能熟练使用至少一门开发语言(如shell、python、Java等)优先考虑。
11、协作与合规、跨部门协作配合开发团队部署应用,协助网络团队排查链路等问题与供应商协调硬件保修(如更换故障硬盘)、备件库存管理。
12、完成领导临时安排的其他工作。