职位详情
网络运维工程师
8000-12000元
深圳智驿未来科技有限公司
重庆
5-10年
大专
11-11
工作地址

重庆经济技术开发区大厦10楼1006

职位描述
核心职责:
平台设计与高可用保障:
基于Kubernetes和Docker,设计、构建和维护高可用、可扩展的容器化平台。
负责核心中间件(如MySQL, Redis)在Kubernetes上或云上的高可用架构设计、部署与日常运维。
规划和实施多可用区(Multi-AZ)、多区域(Multi-Region)的容灾方案。
可观测性体系建设:
运维和管理全链路可观测性技术栈,包括Prometheus + Alertmanager(指标)、Loki + Fluent-Bit(日志)、Tempo(链路追踪)。
基于Thanos/VictoriaMetrics等构建全局的、长期存储的监控体系。
使用Grafana设计和开发统一的可视化仪表盘。
设计和优化告警机制,确保告警的及时性、准确性和有效性,减少告警疲劳。
基础设施即代码与自动化:
精通使用Terraform在AWS/腾讯云上进行基础设施的生命周期管理。
使用Ansible进行系统配置管理和应用部署。
建设和维护CI/CD流水线(Jenkins / GitHub Actions),实现从代码到部署的完全自动化。
成本优化:
持续监控和分析云资源使用情况,识别成本浪费点。
通过资源规格优化、Spot实例/Low-priority实例使用、自动扩缩容、存储分层等策略,有效控制和优化基础设施成本。
为业务部门提供成本分摊和优化建议。
SRE实践:
制定和优化SLO/SLI,通过误差预算驱动业务的稳定性迭代。
参与制定容量规划、应急响应和故障复盘流程。

任职要求:
1. 5年以上运维/SRE相关工作经验,其中至少2年专注于云原生和Kubernetes领域。
2. 有在生产环境大规模管理和运维Kubernetes集群的实战经验。
3. 拥有在公有云(AWS或腾讯云至少精通其一)上设计和运维复杂高可用系统的成功经验。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请