职位名称:网络运维工程师
主要职责:
1.
传统网络架构与运维
- 负责智算中心核心网络及边缘基础设施的规划、部署、监控与优化工作。主导企业级网络架构的稳定性保障,确保7×24小时高可用性,支持Web服务、数据库、企业应用等关键业务的高效运行
2. 高性能网络架构与运维
- 设计并运维智算中心核心网络(InfiniBand/400G/800G IB网),了解RDMA协议栈、GPU Direct通信及存储网络(NVMe-oF),支撑AI分布式训练任务的高吞吐与微秒级延迟需求。
- 开发网络自动化工具(Ansible/Terraform),实现网络配置管理、流量调度与故障自愈,构建基于Telemetry的实时监控体系(Prometheus/Grafana),快速定位网络拥塞及异常流量。
3. 智能安全防护体系构建
- 了解零信任安全架构(ZTA),网络微隔离(基于Calico/Cilium)、动态访问控制(ABAC)及加密通信(IPSec/TLS 1.3),防御APT攻击、横向渗透及数据泄露风险。
- 主导安全合规管理(等保2.0/GDPR),制定网络安全应急预案,了解渗透测试、漏洞扫描及安全加固,确保智算中心全栈合规。
任职资格:
必备条件:
- 学历与经验:网络、计算机科学相关专业本科及以上学历,1年以上超算/智算中心或大型云服务商网络运维经验。
- 核心技术能力:
- 网络领域:
- 精通InfiniBand/Omni-Path架构及性能调优(Subnet
Manager/PKey策略),熟悉RoCEv2协议及拥塞控制算法(DCQCN)。
- 精通主流厂商交换机,路由器,防火墙等网络设备,熟悉网络协议BGP、OSPF、EVPN、MPLS等
- 掌握SDN、VXLAN/EVPN,具备TB级数据传输优化经验。
- 安全领域:
- 熟悉传统防火墙安全规则,堡垒机安全,零信任架构(BeyondCorp)、了解安全攻防技术及主流安全工具(Metasploit/Nmap/Snort)。
- 具备等保2.0三级以上合规实施经验,熟悉安全审计日志分析。
- 编程与工具:
- 熟练使用Python/Go开发自动化脚本,掌握Terraform/Ansible实现网络与安全策略的代码化部署。
- 熟练使用Wireshark、tcpdump及ELK Stack进行深度流量分析与威胁狩猎。
优先条件:
- 持有CISSP、CISP或CCIE
Security认证,具备国家级攻防演练实战经验。
- Kubernetes网络方案(Calico/Cilium)
- 有大规模公有云网络运维经验
- 善于使用AI工具辅助完成工作。
我们提供:
- 接触InfiniBand Quantum-2、400G/800G IB/ROCE计算存储等大规模智算网络
- 接触大规模智算集群的安全,多租户隔离等网络虚拟化方案的设计和实施
如果您对此职位感兴趣,请提交您的简历和求职信进行申请。我们期待您的回音!