岗位要求:
1、 计算机科学或相关专业本科及以上学历,3年以上运维或运维开发经验。
2、精通 Linux 操作系统,能熟练进行问题诊断和性能调优。
3、精通 Ansible 或其它自动化配置管理工具,有大规模环境自动化部署经验。
4、 精通 Shell/Python 脚本编程。
5、深入理解网络、存储、负载均衡等基础设施原理。
6、 具备良好的故障排查能力和抗压能力
7、对GaussDB或GoldenDB的内核机制有深入了解者。
优先条件:
1、有从零开始参与设计或开发数据库管理平台、自动化运维平台经验者。
2、持有华为GaussDB或中兴GoldenDB相关认证者。
3、有大型金融、电信行业核心系统分布式数据库运维经验者。
主要职责
1、负责GaussDB和GoldenDB分布式数据库集群的部署、安装、升级、扩容、备份恢复、性能调优和故障排除。
2、 分布式数据库深度监控与性能容量分析,设计并落实分布式数据自定义巡检模板,定期/按需执行数据库健康巡检。
3、 编写和维护 Ansible Playbooks、Shell/Python 脚本,实现平台下发的各类运维操作(如安装、启停、切换、检查)。
4、 确保脚本的健壮性、幂等性和详细的日志输出,便于平台跟踪任务状态。
5、开发各类检查脚本(OS配置基线、数据库参数一致性、高可用架构静态配置),并将结果标准化上报给平台。
6、深入理解GoldenDB/GaussDB的架构和运维细节,为平台的功能设计提供专业建议。
7、当平台操作失败时,进行深度根因分析,是脚本问题、环境问题还是数据库本身问题。
8、开发或整合故障自愈(Self-Healing)方案,如数据库异常后的自动重启与同步重建。
9、负责运维脚本和平台操作的权限控制、审计和合规性要求。