岗位职责:
1、承接一线升级的复杂故障(如系统性能瓶颈、数据库异常、跨服务联动问题),主导根因分析与解决方案落地
2、深度排査系统日志、监控指标,定位底层问题(含应用、数据库、中间件、网络等层面);
3、对接开发/架构团队,推动故障修复与系统优化,输出临时解决方案及长效改进计划;
4、沉淀故障处理经验,编写标准化手册,赋能一线运维团队,优化运维流程。
任职资格:
1.本科以上学历,计算机相关专业,5 年以上运维经验;
2.深入掌握 Linux 系统原理、MySQL/Redis 等数据库运维、主流中间件(如 Kafka、Nginx)配置与调优;
3.具备 Shell/Python 脚本能力,熟练使用 ELK、Prometheus 等工具进行问题分析;
4.有复杂故障诊断经验,具备良好的跨团队沟通与逻辑分析能力;
5.熟悉至少一种开源运维监控平台,熟悉云安全主要产品类型及原理;
6.积极主动,责任心强,沟通表达能力强,接受日常加班及紧急任务安排。