职位描述
公司介绍:
北京数字基建投资发展有限公司(简称“北京数基建”)成立于2021年1月,是北京亦庄智能城市研究院集团有限公司设立的专业从事数字基础设施建设运营、AI与自动驾驶场景创新落地的全资子公司,注册资本金11亿元。
作为北京高级别自动驾驶示范区和双智城市投资建设的市级平台公司,全面承担北京市双智城市建设任务,开展数字基础设施投资、建设、运营,支撑北京市高级别自动驾驶示范区1.0至4.0阶段建设,以及未来全市高级别自动驾驶布局,全力推动北京数字基础设施建设迈向整体先进、全国先进的全新高度,推动城市数字基础设施行业高质量发展。
作为城市科技型企业,北京数基建始终坚持科技创新和自主研发,结合人工智能科技前沿,构建软件、硬件、算法、数据一体化产品体系和AI智能体产品矩阵,打造以人工智能和自动驾驶技术为牵引的“北京市城市治理AI巡检平台”、“北京市城市家具综合管理平台”和“城市时空智能运营中心”三大平台级场景和应用;投资建设北京市位列前茅、全国先进的5000P智算中心。北京数基建致力于构建顺应韧性城市发展的现代化管理体系,以AI定义城市治理,深度赋能“双智城市”建设。
岗位职责:
1.负责或参与GPU集群建设的总体规划、设计与建设;
2.参与对接客户技术的沟通和谈判。
3.负责帮助发现集群建设和运维中的算力软硬件相关的技术问题、技术方案、故障排除等工作;
4.负责监督现有算力集群软硬件运维情况,包括资源使用情况、状态等,并提出优化改进建议;
5.负责集群技术文档、运维记录的管理,参与应急预案的制定和演练;
6.负责英伟达等GPU厂商以及服务器厂商等生态伙伴的调研和对接;
7.负责人工智能、算力行业的前沿技术跟踪、行业趋势调研。
任职要求
1.硕士及以上学历,计算机、电信、电子、自动化等相关专业优先;
2.具备GPU集群规划设计与建设能力,有大规模算力集群运维经验;
3.了解云计算技术、算力网络、智算中心架构等关键技术原理。
4.熟悉人工智能和大模型行业。
5.非常熟悉英伟达各系列产品,熟悉AMD、昇腾、海光、寒武纪等国内外算力芯片。
6. 善于发现问题,有体系化思维,责任意识强。
7. 主动性及团队能力,有良好的沟通,协作和处理问题的能力。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕