职位详情
业务稳定性保障与运维专家(J14467)
2-3万
易车公司
北京
不限
本科
01-04
工作地址

西直门外大街168-1号

职位描述
注:此岗位是外包性质,在以易车工作。

岗位职责:
1.主导业务稳定性保障体系建设,统筹风险识别、容量规划、应急预案制定与故障演练,牵头解决生产环境雪崩、卡顿等稳定性问题。
2.负责 CDN、LB4/LB7、Nginx、APISIX 等核心网关与流量调度组件的架构设计、优化调优及运维,保障流量分发高效可靠。
3.搭建全链路监控体系,覆盖基础设施、网络、应用、接口等维度,实现异常秒级告警与快速定位。
4.运用开发能力编写自动化工具、脚本及平台组件,提升稳定性保障效率与自动化水平。
5.负责百台级服务器集群运维(含资源调度、监控排查、安全加固),保障集群稳定高效。
6.参与万级 QPS + 高并发业务架构评审与容量评估,前置规避迭代风险,推动研发 / 测试融入稳定性规范。
7.主导重大故障复盘,沉淀根因与解决方案,输出文档及最佳实践,持续优化稳定性体系。
8.深耕 Elasticsearch(ES)、消息队列(MQ)、Redis 等核心中间件,负责其全生命周期运维,含架构设计、部署优化、性能调优及高可用集群搭建,牵头解决缓存穿透、消息堆积、ES 集群分片异常等故障,沉淀运维最佳实践,提供稳定高效的中间件支撑。
任职要求:
核心技能
1.扎实业务稳定性保障经验,参与万级 QPS + 业务,有扛峰值、解复杂故障案例
2.精通 CDN 优化,熟练 LB4/LB7、Nginx、APISIX 配置 / 调优 / 排查,可独立解网关层问题
3.熟练 1 门 + 开发语言,有运维工具 / 大型项目开发经验,能代码解决运维问题
4.百台级服务器集群运维经验,熟悉 Linux 底层与网络原理,具备资源优化、批量运维能力
其他要求
1.本科及以上(计算机相关),5 年 + 互联网运维,3 年 + 稳定性保障经验
2.理解高并发 / 高可用架构,熟悉微服务 / 云原生稳定性保障,能应对分布式系统问题
3.责任心强、有故障攻坚意识,速响应紧急故障,抗压,可夜间应急
4.良好沟通协作能力,可跨团队推动方案落地,善于沉淀分享
5.熟悉 Prometheus、JMeter 等监控 / 压测工具使用及定制
加分项
1.电商 / 直播 / 支付等峰值场景稳定性保障经验优先
2.熟悉云原生(K8s / 容器),有云环境稳定性保障经验优先
3.有 SRE 经验,熟悉 SLO/SLA/SLI 体系设计落地优先
4.有安全攻防、应对网络攻击经验

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请