职位详情
算力调度架构师
2-4万
中国电信股份有限公司北京云网操作系统研发中心
南京
3-5年
硕士
05-21
工作地址

新街口

职位描述

一、岗位职责
1、系统架构设计:
1)负责算力调度相关产品的整体架构设计,涵盖计算、存储、网络等多维资源的融合调度体系。
2)主导平台的持续优化与迭代升级,推动关键技术在大规模分布式环境下的落地应用,提升系统稳定性、扩展性与智能化水平。
2、技术攻关
1)聚焦通用算力(通算)、智能算力(智算)或超算中的一项,负责产品的核心技术攻坚。
2)深入理解AI训练、科学计算、大数据分析等典型应用场景,解决异构资源管理、任务调度优化、性能瓶颈突破等关键问题。
3、调度模型设计与前沿技术探索
1)负责算力调度相关业务场景下的模型设计与算法研究,包括但不限于任务调度逻辑、资源分配策略、负载预测机制等。
2)持续跟踪国内外调度领域、AI驱动调度、强化学习、运筹优化等方向的前沿技术,并能结合实际业务需求进行技术引入与工程化落地。
4、跨团队协同与技术创新推动
1)与产品、研发、运维等多个团队高效协作,推动调度系统与平台的集成与部署。
2)参与行业标准制定、技术白皮书撰写及关键技术专利申报,提升公司在算力网络与调度领域的技术影响力。
二、任职要求
1、教育背景:计算机科学、软件工程、通信工程或相关领域硕士及以上学历;
2、工作经验:至少3年以上云计算、分布式系统、资源调度或相关领域的架构设计经验。
3、项目经验:
1)具备成功设计并实施大规模分布式系统调度平台的经验;
2)有参与通算(通用计算)、智算(智能计算)或超算(超级计算)项目的经验者优先;
3)熟悉AI训练、大数据分析等应用场景,并有实际项目落地经验者优先。
4、技术能力(架构设计):深入理解云计算平台架构(如Kubernetes、OpenStack、AWS、Azure等),具备设计复杂系统的能力,能够处理高并发、高可用性和高性能需求。
5、调度算法:对静态调度、动态调度、负载均衡等调度方式有深入理解;精通轮询、最小剩余时间优先、优先级调度等基础调度算法,以及高级调度算法(如基于机器学习的预测调度、强化学习调度等);能够根据业务需求设计合适的调度模型与算法,并进行性能评估与优化。
6、编程技能:熟练掌握Python、Java、Go中的一种或多种编程语言,具备良好的代码质量和文档习惯。
7、网络与存储技术:熟悉无损网络RDMA技术及其在大规模数据传输中的应用;了解分级存储策略的设计与实现方法,了解主流存储技术和解决方案。
三、综合素质
1、问题解决能力:具备出色的逻辑思维能力和问题解决技巧,能够在复杂的分布式环境中快速定位并解决问题。
2、沟通协作能力:具有优秀的口头和书面表达能力,能够在跨部门团队中有效沟通,推动项目的顺利进行。
3、创新意识:对新技术保持高度敏感,能够持续跟踪并引入前沿技术,推动技术创新与实践。
4、自我驱动:具备较强的学习能力和自我驱动力,能够在快节奏的工作环境中独立承担任务并按时交付高质量成果。
四、加分项
1、有开源项目贡献经历或担任过开源项目维护者;
2、对AI/ML领域有一定了解,并有相关实践经验者优先。
3、拥有PMP、CISSP等相关专业认证;
4、具备电信运营商、大型互联网企业或知名云计算厂商工作经验。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请