1、负责信息系统日常维护与运维工作,开展日常巡检、隐患排查及问题整改,保障系统基础运行环境稳定;
2、负责系统全生命周期监控与优化,重点跟踪性能瓶颈、容量负载、运行稳定性等核心指标,制定并执行调优方案,确保系统可用性与服务质量达标;
3、负责系统故障的诊断与闭环处理,协调跨部门 / 跨团队资源定位故障根本原因,组织复盘分析并输出标准化故障报告,推动问题根治与流程优化;
4、负责系统技术文档的编写与迭代,包括但不限于系统台账、拓扑架构图、业务流程图、部署实施方案、现场应急处置方案、接口交互清单及微服务清单,确保文档的准确性与可读性;
5、熟练掌握 CentOS、欧拉等主流 Linux 操作系统原理,能灵活运用系统操作命令完成环境配置、权限管理、性能排查等工作;
6、熟悉华为云 / 阿里云等公有云平台的核心服务(如计算、存储、网络等)操作与应用部署,熟练使用 Kubernetes(K8s)命令行工具进行容器集群管理、资源调度及应用运维;
7、具备扎实的电力行业专业知识,熟悉电力业务场景及相关系统逻辑,能结合业务需求提供技术支撑;
8、深入理解 PostgreSQL、MySQL、GaussDB、Redis 等数据库的架构与原理,具备熟练的 SQL 语句编写能力,能独立完成数据库性能优化、数据备份恢复及故障应急处置;
9、具备 Shell 脚本编写与自动化运维能力,能通过脚本实现巡检、监控、部署等重复性工作的自动化,提升运维效率;
10、具备强烈的责任心与高效的抗压能力,拥有优秀的跨团队沟通协调与合作意识;具备主动学习能力与问题攻坚思维,能快速响应技术挑战并推动解决方案落地。