【职位概述】
作为我们学院AI算力与创新生态的核心运营者,您将肩负起规划、推动和管理学院核心算力基础设施与关键技术项目的重任。您需要深度链接前沿学术研究与先进计算资源,通过卓越的项目管理、高效的资源协调和清晰的战略规划,确保算力平台稳定高效运行,并全力支撑学院内科学家、研究员、学生及合作伙伴的科研创新与项目落地。您是技术专家、项目经理和业务伙伴的三重角色融合者,是推动学院人工智能领域发展的关键引擎。
【主要职责】
1.算力与数据平台战略与全生命周期管理:
•规划与设计:牵头制定学院AI算力平台(如GPU集群)、数据平台的长期技术发展路线图与资源规划,确保其技术先进性与资源充足性,满足学院日益增长的科研需求。
•项目管控:全面负责算力平台开发、升级、扩容项目的计划制定、预算编制、资源协调、进度跟踪、风险识别与质量把控,确保项目按时高质量交付。
•运营优化:监控平台运行状态与资源利用率,持续优化调度策略,提升算力使用效率与成本效益。负责处理平台运行中的重大故障与应急事件。
2.科研需求对接与生态合作赋能:
•需求挖掘:主动与学院的科学家、研究团队、博士生及博士后等进行沟通,深入理解其研究项目对算力、数据和工具链的具体需求,提供技术解决方案咨询。
•客户成功:作为主要技术接口人,对接合作企业,理解其联合研发或技术合作需求,确保算力资源能有效支撑产业合作项目的实施与交付。
•社区建设:组织技术培训、工作坊和分享会,提升学院师生对算力平台的使用能力,构建活跃的技术交流社区。
3.技术项目管理体系与标准化建设:
•流程制定:建立并完善学院级技术项目的立项、评审、执行、结项全流程管理规范与标准,引入最佳实践(如Agile,DevOps)。
•质量与效能提升:通过工具化、自动化手段,优化项目管理流程,提升跨团队协作效率。建立项目评估体系,定期复盘,持续提升项目交付质量和成功率。
•知识管理:推动项目文档、技术资产的沉淀与共享,形成学院的知识库。
4.跨团队协同与资源整合:
•协同基础设施团队、研发工程师、科研团队及外部供应商,形成高效协作机制,确保项目目标一致、信息畅通。
•高效协调计算、存储、网络等资源,优先保障重点科研项目的需求,实现资源的最优配置。
【任职要求】
必备条件:
1.教育背景:硕士及以上学历,计算机科学、软件工程、人工智能、电子工程或相关领域。
2.行业经验:拥有3年以上人工智能、高性能计算(HPC)、云计算或大型系统集成领域的技术项目管理经验,深刻理解AI模型训练、推理对算力资源的需求特点。
3.项目管理能力:精通项目管理方法论(如PMP/Prince2/Agile),具备出色的多项目并行管理能力,能从复杂需求中厘清优先级,并以结果为导向推动项目落地。
4.技术理解力:对GPU计算、分布式存储、容器化技术(Docker/Kubernetes)、云原生体系有扎实的理解,能与技术团队进行深度对话。
5.沟通协调能力:具备极强的人际沟通、协调和推动能力,能够高效地与不同背景的stakeholders(科研人员、学生、企业伙伴、管理层)进行沟通,并达成共识。
6.结果导向:强烈的责任心和自驱力,以达成项目目标和支持科研成功为最终工作成果的衡量标准。
【优先考虑】
•拥有在科研院所、高校或大型科技企业算力平台部门的项目管理或运营经验。
•有实际参与过AI算力平台(如NVIDIADGX集群,Kubernetes调度等)建设或运营经验者。
•对主流AI框架(如TensorFlow,PyTorch)和机器学习运维(MLOps)有实践经验者。
•持有PMP、ACP、CSM或其他高级项目管理认证者。
【我们为您提供】
•一个位于学术与创新前沿的工作环境,与世界顶尖的科学家和研究员共事。
•参与塑造未来人工智能技术基础设施的宝贵机会。
•具有竞争力的薪酬福利和广阔的职业发展空间。
•支持您持续学习与发展的培训资源。