职位详情
运维工程师 / SRE(网络服务方向)
1.6-2万
重庆一顺信息技术服务有限公司
重庆
3-5年
本科
12-03
工作地址

龙湖重庆时代天街-A馆

职位描述
核心职责 (Core Responsibilities)
高可用性与服务保障: 负责全球代理节点(VLESS/Trojan/VMess等)的 7x24 小时稳定运行,通过持续优化确保服务的高可用性(High Availability)。
自动化运维体系建设: 设计并实现节点、面板、证书和数据库的自动化部署、配置管理和生命周期管理,提高运维效率和一致性。
网络架构与优化: 负责全球节点路由(BGP/CN2 GIA/隧道)的规划、部署和持续优化,最大限度降低用户延迟和丢包率。
安全防御与应急响应: 建立和维护网络安全防护体系,包括 DDoS/CC 攻击应对、服务器安全加固和突发故障的快速响应与处理。
监控与性能调优: 搭建和维护完善的监控(Prometheus/Grafana)及日志(ELK/Loki)系统,进行系统内核和代理应用层面的性能优化。
🛠️ 核心技能要求 (Must-Have Technical Skills)
1. 代理与网络协议
深入理解 VLESS、Trojan、VMess 等主流代理协议的工作原理、配置和优化技巧,有 Xray/Sing-box 等核心项目的实践经验。
精通 TCP/IP 协议栈,能够理解和调优 TCP 拥塞控制算法(如 BBR)、MTU、路由表和防火墙(iptables/nftables)。
熟练掌握 TLS/SSL 证书管理,能够实现自动化续期和配置,并理解流量伪装(如 Reality/XTLS)机制。
具备 使用 tcpdump、mtr、netstat 等工具进行复杂网络故障诊断和抓包分析的能力。
2. 自动化与基础设施
精通 至少一种配置管理工具(如 Ansible),实现大规模节点的批量配置和维护。
熟悉 Linux 操作系统(Ubuntu/CentOS/Debian),具备深厚的 Shell 脚本编写能力。
熟悉 容器化技术(Docker/Docker Compose)和虚拟化环境管理。
加分项: 具备使用 Terraform/Cloud-init 等工具进行基础设施即代码(IaC)的经验。
3. 监控与安全
具备 搭建、维护 Prometheus + Grafana 监控报警系统的实战经验,能够根据业务特点编写自定义指标。
具备 DDoS/CC 攻击防御和清洗的实战经验,熟悉主流高防服务(如 Cloudflare Magic Transit、阿里云高防)的接入和配置。
熟悉 Linux 系统安全加固策略、权限管理和审计。
🎓 基本要求与软性素质 (Qualifications & Soft Skills)
学历经验: 计算机科学、网络工程相关专业背景优先,具备 2-4 年 互联网公司或网络服务 SRE/运维经验。
责任心强: 对服务的高可用性有强烈的责任感,具备在压力下快速决策和解决问题的能力。
独立工作能力: 能够独立承担并完成复杂的运维任务,具备良好的学习能力和技术钻研精神。
工作时间: 必须接受并能够适应 7x24 小时轮值待命(On-call),及时处理紧急故障。
分布式办公 分布式办公

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请