职位详情
算力平台与调度运维工程师
面议
中国联通-中国联通青海省分公司
西宁
无经验
本科
09-12
工作地址

青海省、西宁市、城中区

职位描述
【岗位职责】
1.负责 Slurm/Kubernetes/OpenStack 等算力调度平台的部署、配置、升级与维护,保障高可用性与安全性;
2.监控计算集群资源利用率(CPU/GPU/ 内存 / 存储)、作业队列及系统性能,分析瓶颈并调优调度策略与资源分配算法,提升整体效率;
3.处理用户作业问题、权限申请及资源请求,管理用户账户、配额与计费信息;
4.开发维护应用相关工具链,含 Harbor 镜像仓库、CI/CD 集成、Grafana 监控告警及平台自动化运维脚本;
5.跟踪新型算力平台、调度器及容器技术(如 Kubernetes on HPC、Kubeflow),评估引入可行性。​
【任职要求】
1.学历要求:大学本科及以上;
2.专业要求:计算机相关专业;
3.精通至少一种主流调度器(Slurm/LSF/PBS)或云原生平台(Kubernetes),理解其架构和原理;
4.精通Docker容器技术,熟悉Kubernetes的Pod.Deployment.Service等概念和运维;
5.熟练使用Prometheus, Grafana等监控工具。必须精通Python/Go/Shell中的至少一种,具备强大的自动化开发能力;
6.对资源和性能敏感,有强烈的优化意识。具备出色的沟通能力,能很好地支持研发用户。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

为您推荐更多相似职位
立即申请