岗位职责:
1.深入调研与分析系统架构,精准找出薄弱环节,精心编写混沌实验场景,为系统稳定性评估提供有力支撑。
2.指导用户开展混沌实验,细致编写实验报告,深度分析系统风险点并给出针对性改进意见,助力系统优化升级。
3.依据用户需求,全面梳理混沌实验流程与规范,确保实验高效、有序进行,提升整体工作质量。
4.积极推广混沌工程文化,为团队赋能,通过培训与布道等方式,提升团队成员相关技能与认知。
岗位要求:
1.统招本科及以上学历,计算机或相关专业,具备扎实的专业理论基础,为岗位工作提供知识支撑。
2.熟悉 Linux 操作系统,能熟练进行系统操作与管理,保障系统稳定运行,满足日常工作需求。
3.掌握计算机网络基本知识,有网络运维经验者优先,能更好地应对网络相关问题,提升工作效率。
4.熟悉云原生技术,如 K8s、Docker 等,有云原生应用系统运维经验者优先,适应技术发展趋势,保障系统在云环境下稳定运行。
5.熟悉企业常用高可用技术方案及 L4/7 层负载均衡机制,能够有效保障系统的高可用性与负载均衡。
6.深刻理解分布式系统原理与设计模式,如一致性算法、分布式存储等,为复杂系统设计与优化提供专业支持。
7.掌握至少一种脚本语言,如 Python、Shell 等,可编写自动化脚本实现系统部署与配置管理,提高工作自动化水平。
8.熟悉应用系统稳定性指标模型,熟悉SLO可用性指标,熟悉应用系统常用稳态指标比如TPS、RT、成功率、RTO、RPO等,能够基于测试指标进行应用系统稳定性分析。
9.责任心强、积极主动、热爱学习,具备良好的逻辑分析、沟通及团队合作能力,保障工作高效开展与团队协作顺畅。
10.有银行、证券、基金、保险等金融行业运维经验者优先。