岗位职责:
(1)负责云平台项目部署实施工作,根据项目需要,完成基础资源规划、系统搭建与扩容、文档编制、安全检查等工作;(2)负责虚拟化管理平台Fusion Sphere,Openstack,VMware vSphere的运维、备份(Veritas)、监控(Zabbix,Nagios)、故障分析、日常巡检和技术支持工作;
(3)根据安全规范对辖内系统进行安全加固、补丁评估、测试安装工作; (4)负责虚拟化IAAS层服务器,网络,存储硬件的维护工作、日常巡检;(5)具有公有云或专有云网络运维、网络自动化实践经验的优先;(6)设计、构建和维护高可用、可扩展的云基础设施;制定并实施SLA、SLO、SLI指标,持续优化系统稳定性;确保服务可用性。(7)开发自动化工具(Python/Go/Shell等)替代重复性运维操作;主导CI/CD流水线设计(Jenkins/GitLab CI/ArgoCD),推动Infrastructure as Code(Terraform/Pulumi)。(8)主导根因分析(RCA),解决复杂分布式系统的故障;(9)编写运维文档,制定灾备和应急预案。
岗位要求:
(1)统招本科及以上学历,3年以上云计算相关建设或运维工作经验,熟练掌握主流云计算产品的配置与管理; (2)熟悉云计三层架构,特别是IAAS层的部署架构,具有Openstack、华为云Fusion Compute、VMware vSphere的维护经验,具备华为云平台认证证书者并参与运营商资源池建设者优先;(3)熟悉Windows Server&Linux系统。熟悉常用系统运维命令,具有一定的shell脚本经验者最佳,有一定的自动化运维工具如:ansible,saltstack等配置使用经验;(4)熟悉SAN存储架构,具有HP,日立,富士通,EMC,华为两个以上厂家存储以及Brocade SAN交换机的维护经验,熟悉分布式存储Ceph架构和常用管理工具和命令;(5)至少具备Veritas,爱数,Veeam等一种备份系统配置维护经验;(6)具备Docker,K8s平台的管理运维经验;(7)具备Asiainfo,奇安信,Symantec等厂家常用的杀毒软件部署和维护经验;(8)具备对云平台灾备、网络、安全、升级、虚拟机管理、监控(Zabbix,Nagios)、故障排除经验;(9)了解两个以上厂家的公有云,如:天翼云,阿里云,华为云,AWS,Azure等;(10)具备较强的学习能力、沟通能力、和抗压能力;