职位描述
岗位职责
- 负责高性能计算集群的硬件规划、设计和部署实施工作
- 进行服务器、存储设备、网络设备等硬件系统的安装、调试和维护
- 设计并实施HPC集群的网络架构,包括IB网络、以太网等互联方案
- 制定并执行HPC系统的运维方案,确保系统稳定运行
- 进行系统性能调优,提升计算集群整体效能
- 解决集群运行过程中的硬件故障和技术问题
- 编写技术文档,包括系统部署文档、运维手册等
- 为用户提供技术支持和培训指导
任职要求
- 计算机、电子工程或相关理工科背景
- 具备3年以上HPC相关工作经验
- 熟悉服务器硬件架构,具备丰富的服务器装配、调试经验
- 精通Linux操作系统及常用命令
- 熟悉HPC集群架构,了解主流的调度系统(如Slurm、PBS等)
- 具备IB网络、以太网等网络规划和配置能力
- 具有较强的问题分析和解决能力
- 良好的沟通能力和团队协作精神
工作技能
- Linux系统管理
- 服务器硬件维护
- 网络配置与故障排查
- 存储系统部署
- Shell脚本编程
- 性能监控与分析
- 项目管理
薪资待遇
- 具有竞争力的薪资方案
- 五险一金
- 节日福利
- 定期培训
- 晋升空间
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕