1、客户整体服务器运维方案的设计及落地。
• 设计、部署和维护集中式监控系统,实时监控服务器、网络、应用、数据库等关键指标。
• 配置有效的告警策略,确保及时发现并响应系统异常。
• 定期分析监控数据,进行容量规划和性能优化。
2、主导客户服务器的Troubleshooting和相关技术的support,以及故障说明。
• 快速诊断、定位并解决线上系统故障、性能瓶颈和安全事件。
• 参与制定和执行应急预案,进行故障演练。
• 撰写详细的故障分析报告,推动问题根治。
任职要求:(服务器)
1、具有5年及以上的Windows/Linux等服务器构筑运维经验。
2、掌握虚拟化(VMWARE,HyperV,KVM/Docker),至少精通python,shell等一种脚本语言。具有云平台经验者优先(AWS/ Azure/ Aliyun等)。
3、精通Linux系统(CentOS/Ubuntu等)及常用服务(Nginx/MySQL/Redis等)。
4、具有良好的客户沟通能力和表达能力;有持续学习的能力和对技术学习的渴望,性格开朗,愿意融入团队。
5、熟悉网络协议(TCP/IP/BGP)及设备(交换机/路由器/防火墙)配置。
6、具备存储系统(RAID/集群架构)和数据库运维能力。
7、有外资企业经历,有中大型服务器工程的设计、推进,安装、配置、排障等经验者优先。
8、语言,英语读写能力(会日语者优先)。