职位描述
岗位职责:
1.研发智能算力调度算法,提升GPU/CPU集群利用率
2.设计负载均衡与弹性伸缩策略,优化多租户资源分配
3.构建算力预测模型,实现成本与性能最优平衡
4.参与算力平台后台开发,负责监控、计费等核心模块
5.跟踪调度技术前沿,探索AI优化资源管理的新方法
任职要求:
1.本科及以上学历,计算机相关专业,3年以上算法/后端经验
2.1年以上云计算/算力调度相关经验,熟悉分布式系统
3.精通Python/Go/Java至少一门,算法基础扎实
4.熟悉Kubernetes/Docker及常见调度算法
5.掌握TensorFlow/PyTorch至少一种机器学习框架
6.了解算力租赁业务,对资源利用率等指标敏感
优先条件:
1.有GPU集群调度、vGPU/MIG技术实战经验
2.熟悉主流云厂商算力产品调度机制
3.参与过开源调度系统开发或有相关专利
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕