岗位职责
1、业务系统的运维,包括应用监测与维护、事件和服务请求响应及处理、应用发布等,从业务操作上对问题进行诊断及跟进解决。
2、业务系统的优化工作,包括应用系统架构、监控、容量、性能等方面进行分析从而提前发现隐患问题,并推动优化解决,不断提高系统运行稳定性。
3、应用系统重大故障快速诊断及解决,跟进及推动故障改进措施实施。制定系统运行应急方案,使用应急预案优先恢复应用系统。
4、参与研究运维相关技术,根据业务需求制定运维技术方案。
5、编写维护业务系统的部分运维文档和管理文档。负责数据库备份,版本代码管理及备份维护
任职要求
1、计算机或相关专业本科以上学历,3年以上运维经验,有较强的动手能力;
2、具备良好的团队合作精神、较强的自驱力,抗压能力,沟通能力,责任心以及独立解决问题的能力;
3、熟悉IDC和阿里云产品/服务的环境和管理,具体一定网络安全知识和网络安全配置能力;
4、熟悉网络原理和TCP/IP协议,精通HTTP(S)协议,能抓包分析并快速定位故障原因。
5、熟练掌握常用的监控工具(如zabbix,promethus),持续集成jenkins+saltstack自动化部署工具。
6、熟练编写shell运维脚本、熟悉linux系统命令、熟练使用nginx、zabbix、granfa、gitlab、elk等常见运维平台和工具; 熟悉ES、MYSQL
7、深入了解微服务架构,有丰富的docker和k8s管理经验,有大规模k8s集群运维经验优先;
,熟悉虚拟化解决方案:如VMware、kvm;
8、熟练使用LVS,Nginx,Haproxy, keepalived,反向代理搭建,高可用负载均衡搭建等;
9、可以接受早晚班及特殊时间段运维工作安排;
2、熟悉Linux(CentOS)和Windows Server操作系统;
3、熟悉TCP/IP七层协议,熟悉交换机、路由器、防火墙、WAF等软硬件产品的参数配置及优化,能对网络故障快速定位,能追踪相关协议包深层次分析解决问题;
4、熟悉bat、Powershell、shell脚本,熟练编写使用运维脚本;
5、熟悉Zabbix、prometheus、CAT、skywalking等监控工具;
6、熟悉MySQL、Redis、MongoDB、Nginx、ELK、kafka等的高可用架构,熟悉其部署及配置调优。有分布式、大规模数据处理维护经验的优先;
7、熟悉容器云技术,能够熟练部署和运维Kubernetes环境,能够编写常见应用的编排文件,有大规模生产集群运维经验优先。