职位描述
必须要有HCIE证书
负责集群中网络设备的日常服务管理和健康性维护,按照客户要求提供华为产品支持多厂家产品统一运维,包括针对三方产品联系相应质保(保修)/维保厂家获取相关技术支待。
对于故障现象为网络类问题或根据TAM指派,牵头相关跨域故障定界,确定是否为网络故。
故障处理:
1、提供对告警监控的降噪分析,优化告警规则,提升告警处理效率。
2、针对域内提供网络设备的故障识别、问题定界定位的技术支持服务。
问题处理:
1、对遇留问题进行分析、总结、跟踪闭环,及时输出案例进行知识沉淀。
投诉处理:
1、当前服务主要针对报障类投诉进行处理,当AI框架及以上的故障定界定位到网络设备之后,提供问题定位并辅助解决的能力。
变更处理:
1、对由投诉、配置操作、安全事件提出的疑难、复杂类变更申请,提供变更的技术评审远程变更的操作,以及变更过程中保障,操作后的验证服务。2、对由故障单触发需进行的疑难、复杂变更,提供变更方案,并联合领域业进行变更评市远程变更的操作,以及变更过程中保障,提作后的验证服务。
巡检预防:
协助完成对智算集群中网络设备的巡检方案、健康检查方案、应急方案的输出提供节假日远程保障,重大事件保障等服务。
技能要求:
1、精通路由&交换技术,安全技术中任一技术领域,具有跨领知识者优先;
2、至少精通华为、Cisco、Juniper、H3C等厂商的一款主流产品如:路由器、交换机、防火墙、UTM、IPS等,熟悉设备安装、设备特性和配置、调试和维护:
3、有丰富的网络工程与运营维护、网络设备调试、网络规划设计、方案实施及日常维护、现场故障处理等经验;4、具有中等规模网络(50台左右)的项目交付经验,以及带领团队参与至少10个项目的交付经验者优先;5、具备HCIE证书,具有多个HCIE/CCIE/CISA认证证书者优先:精通智算相关HCCL、RoCE基础技术,具备处理相关问题的能力:
7、对于智尊常见端口闪断、光弱和脏污等问题,具备独立分析能力并能够迅速定位根因,提供解决方案。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕