任职资格:
  1. 目前团队处于组件中状态,工作内容涉及的范围比较广,需要对外沟通协调落地稳定性配置,对内开发稳定性配置  
2. 需要掌握公有云、专有云、开发、监控、告警等多方面的能力  
4. 具备华为云、阿里云、腾讯云、vmware等云平台的运维经验者优先;  
5. 具有K8S、Linux、网络、容器、存储、虚拟化、云计算、容灾备份和信息安全等相关配置和运维经验;  
6. 熟悉负载均衡、数据库、消息队列、分布式、微服务等技术栈以及相关工具使用和运维;  
7. 能够独立分析问题、解决问题,具有较强的学习能力,有较高的责任心,善于团队交流与合作;
  
  岗位职责:
  1.阿里公有云、专有云平台上的应用部署与环境管理(容器部署模式和传统服务器模式):负责应用系统的迭代部署,基础镜像的管理更新,云平台账号权限等相关事宜。  
2.性能优化与容量规划:对应用程序进行性能监测和优化,提高应用的响应速度和可扩展性,进行容量规划与优化(包括容器资源、数据库资源等)以满足业务需求。  
3.故障排除与问题处理,应用板块支持:对接研发、测试部门及SRE技术支持,负责应用系统在开发、测试、部署、运行过程中遇到的故障排除和问题处理。根据所分到的应用板块进行应用板块内的运维支持,支持其他部门同事了解云上内容知识,推动普适性稳定性配置到所支持的板块内。  
4.巡检、监控与报警:建立和维护应用系统的监控系统,及时监控和收集应用的运行数据,发现异常告警并进行处理,推动核心、关键链路上下游的接口监控告警体系建设,做好应用上线前规范、运行中巡检工作、工作日及周末会有值班安排,保持电话OnCall。  
5.文档编写和知识分享:撰写应用程序操作手册、配置说明等文档,分享工作经验和技术知识,保障工作的高效性和可持续性。