岗位职责:
1、负责IT基础设施的实时监控,通过Zabbix、Smokeping、Grafana等工具追踪服务器、网络设备及应用系统的关键指标,确保监控覆盖率达标。
2、接收并响应告警信息,按优先级分级处理:低优先级告警(如非核心设备轻微负载波动)即时记录,中高优先级告警(如服务不可用、备份失败)10 分钟内启动初步排查。
3、维护监控仪表板与视图,确保设备状态、性能数据等可视化展示准确,发现监控盲区及时反馈优化。
4、对常见故障进行基础诊断:通过 ping、traceroute等命令检测网络连通性,使用 Linux 基础命令(top、free、ps)查看系统资源占用,定位简单问题根源。
5、执行标准化故障处理流程:能独立解决密码重置、端口重启、基础配置恢复等 L1 级问题,对复杂故障在 30 分钟内完成信息收集并升级至网络工程师工程师,同步附上排查记录。
6、跟进故障修复进度,在公司内部中实时更新处理状态,确保故障闭环。
7、按规范记录所有事件:详细录入告警时间、故障现象、处理步骤、解决方案等信息,确保日志完整性与可追溯性。
8、参与知识库建设:整理常见问题(如 CPU 超标、DNS 解析失败)的解决方法,提交文档至团队共享平台,协助完善操作手册。
9、输出基础运营报表:按日/周/月统计告警数量、故障处理时长、设备在线率等数据,为运维优化提供基础素材。
10、配合网络工程师完成日常运维任务:包括设备巡检、备份监控、配置文件备份等,确保执行结果符合 SOP 要求。
11、处理基础用户需求:响应内部团队的网络接入、权限申请等请求,按流程完成审批与配置操作,保障合规性。
12、对接第三方服务商:在资深工程师指导下,传递设备故障信息、跟进维修进度,协助完成服务质量验证。
必备技能:
1、具备基础网络与系统知识,能看懂简单网络拓扑图,掌握ping、ipconfig等常用诊断命令;了解至少一种监控工具(如Cacti、Zabbix、Smokeping)的基本操作。
2、严格遵循标准化操作流程,能准确填写运维记录,避免因操作不规范引发次生问题。
3、具备清晰的口头与书面表达能力,能准确传递故障信息;可快速融入团队,配合跨角色完成任务。
4、对运维技术有浓厚兴趣,能主动学习监控工具进阶用法与故障排查技巧,适应技术迭代需求。
其他:
1、1-2年工作经验。2、大专及以上学历,计算机、网络工程、通信工程等相关专业优先。3、认证与技能:持有华为HCIP认证或红帽RHCE认证者优先;了解 TCP/IP 协议、DNS、VPN 等基础网络概念,熟悉 Linux 系统基本操作。