网络工程师
8000-15000元
长沙 本科
地宝大厦A座23楼
岗位职责:
1.负责千卡GPU集群的网络架构设计与部署,包括Spine-Leaf、胖树等拓扑的搭建,确保网络满足大模型训练的高带宽、低延迟需求。
2.负责高速网络设备(100G/400G交换机)的配置、调试与优化,保障网络链路的稳定性与传输效率。
3.监控集群网络运行状态,及时处理网络故障(如链路中断、拥塞等),优化网络流量分配策略。
4.针对大模型训练中的集体通信需求,优化网络参数与通信协议,减少网络延迟对训练效率的影响。
5.参与集群网络的扩容与升级工作,保障网络架构的可扩展性。
任职要求:
1.本科及以上学历,网络工程/计算机相关专业,4年以上高速网络设计与运维经验,有GPU集群网络搭建经验者优先。
2.精通网络拓扑设计,熟悉Clos、Dragonfly等集群网络架构,掌握RoCEv2、IB等高速网络技术。
3.熟练配置主流品牌交换机(如华为、思科、Mellanox),具备网络故障排查与优化能力。
4.了解大模型训练的网络需求,能针对集体通信场景进行网络优化。
5.具备较强的学习能力,能跟进网络技术的前沿发展。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕