1.阿里公有云、专有云平台上的应用部署与环境管理(容器部署模式和传统服务器模式):负责应用系统的迭代部署,基础镜像的管理更新,云平台账号权限等相关事宜。
2.性能优化与容量规划:对应用程序进行性能监测和优化,提高应用的响应速度和可扩展性,进行容量规划与优化(包括容器资源、数据库资源等)以满足业务需求。
3.故障排除与问题处理,应用板块支持:对接研发、测试部门及SRE技术支持,负责应用系统在开发、测试、部署、运行过程中遇到的故障排除和问题处理。根据所分到的应用板块进行应用板块内的运维支持,支持其他部门同事了解云上内容知识,推动普适性稳定性配置到所支持的板块内。
4.巡检、监控与报警:建立和维护应用系统的监控系统,及时监控和收集应用的运行数据,发现异常告警并进行处理,推动核心、关键链路上下游的接口监控告警体系建设,做好应用上线前规范、运行中巡检工作、工作日及周末会有值班安排,保持电话OnCall。
5.文档编写和知识分享:撰写应用程序操作手册、配置说明等文档,分享工作经验和技术知识,保障工作的高效性和可持续性。