一、职位描述
1. 系统部署与实施:
•负责公司软件产品、解决方案在客户现场或云环境的部署、安装、配置和升级。与开发团队和客户紧密协作,确保项目实施交付的顺利进行,满足业务需求和性能指标,
•编写和实施部署方案,部署运维流程,
2.智能监控与故障处理:
•设计、搭建和维护智能监控告警体系,实现7x24小时对系统应用、网络、服务器资源的全方位监控。
•利用日志分析平台进行日志聚合、分析和故障根因定位,快速响应并处理。
•探索并实践,利用机器学习算法对监控数据进行分析,实现异常检测、故障预测和智能告警,交被动运维为主动预防。
3. 文档与知识沉淀:
•编写和维护技术文档,包括系统架构图、部署手册、运维手册、故障处理手册等
•沉淀运维知识,形成解决方案库,并赋能团队。
二、核心能力与素质要求
•出色的沟通能力和团队协作精神,能够与开发、测试、产品及客户等多方角色有效协作。强烈的责任心和主人翁意识,对系统的稳定性和性能有极致追求。
•具备优秀的学习能力和技术热情,能持续关注并学习业界新技术和趋势。具备良好的文档编写能力和逻辑思维能力。