职位描述
1. 系统全栈保障: 负责项目涉及的操作系统、网络、数据库、应用及中间件等全栈技术组件的规划、部署、配置、优化与稳定运行。
2. 安全合规守护: 作为第一责任人,确保所有系统建设与运维活动严格遵循国家电网公司安全规程及信息安全管理标准,管理并优化安全策略。
3. 性能与连续性管理: 主导建立系统监控、性能分析、容量规划体系,设计并执行高可靠的数据备份与灾难恢复方案,保障业务7x24小时连续稳定。
4. 复杂问题攻坚: 牵头负责重大及疑难故障的紧急响应、根因分析与彻底解决,并推动形成长效机制,预防问题复发。
5. 项目技术实施: 在项目实施阶段,负责技术方案的落地、系统集成、调优与风险评估,确保项目技术目标高质量达成。
6. 知识沉淀与赋能: 总结最佳实践,编写技术文档,并指导L4及以下工程师,提升团队整体技术水平。
三、 任职要求(必备条件)
基础要求:
· 本科及以上学历,计算机、通信、自动化等相关专业。
· 至少4年及以上中大型IT系统(非单点应用)的项目实施与运维工作经验。
· 具备优秀的客户沟通与协调能力,能够与客户技术团队高效对接,清晰呈现技术方案与问题分析。
核心技术能力要求:
1. 操作系统与网络(精通):
· 精通Linux/Unix系统的内核调优、高可用配置及故障处理。
· 深入理解TCP/IP协议栈,熟练掌握路由交换、VPN、DNS等技术的原理与排障。
2. 数据库管理(专家级):
· 精通至少两种主流数据库(Oracle必须,MySQL/PostgreSQL等任选)的安装、配置、备份恢复、性能监控与SQL调优。
· 具备丰富的数据库性能诊断与优化经验,能解决高并发、大数据量场景下的瓶颈问题。
3. 监控与性能优化(体系化):
· 熟练运用Zabbix、Prometheus等监控工具,并能够结合日志分析(ELK stack等)进行系统性性能瓶颈定位与容量规划。
4. 【L4+】安全合规与管理(红线能力):
· 必须熟悉并理解《国家电网公司电力监控系统安全防护规定》等相关安全规程。
· 具备防火墙、IDS/IPS、WAF等安全设备的策略配置、审计与管理能力。
5. 【L4+】应用与中间件运维(深度掌控):
· 精通Nginx/Tomcat/WebLogic等应用服务器的集群部署、性能调优(如JVM)。
· 熟悉Redis、RabbitMQ/Kafka等中间件的原理、部署、监控与高可用方案。
6. 【L4+】备份与容灾(业务视角):
· 能基于业务连续性要求(RTO/RPO)设计并实施跨机房、跨地域的数据备份与恢复演练方案。
7. 【L4+】技术实施与风险控制(项目视角):
· 具备从技术角度评估项目风险、进行系统容量规划与性能压测的能力。
8. 【L5+】问题分析与故障管理(专家核心):
· 拥有处理过影响业务的核心复杂故障的完整案例,能运用科学方法论进行根因分析,并推动流程改进。
四、 优先考虑条件
· 有电力、能源、金融、电信等行业大型央企IT系统运维经验者。
· 持有RHCA、OCM、CISSP、CISP、PMP、或国家电网认可的相关技术认证者。
· 有自动化运维(Ansible/Puppet)、 DevOps或云原生(K8s/Docker)实践经验者。
五、 我们提供
· 具有市场竞争力的薪酬体系(L5-L8宽带薪酬)及丰厚的项目绩效奖金。
· 完善的五险一金及补充商业保险。
· 年度健康体检、带薪年假、节日福利、技术培训基金等全方位福利。
· 与技术大牛共事,参与行业前沿技术实践的学习成长环境。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕