【岗位职责】
1、产品规划与设计
负责面向工业场景的B端算力集群(分布式训练/推理平台)及C端AI一体机(边缘计算设备)的行业需求分析、核心功能定义与技术方案设计,输出PRD及原型文档。
主导产品技术标书撰写(含技术规格、适配方案、性能参数)、报价方案设计与成本核算,联动供应链团队完成硬件定制化开发。
2、行业场景落地
深入工业客户现场(如智能制造、能源监测),挖掘AI推理、实时数据分析等场景痛点,定义算力集群的性能-成本-功耗平衡点,设计差异化解决方案。
联动算法团队,将分布式训练框架、模型压缩技术转化为可落地的产品功能,推动工业级AI模型的端到端部署。
3、技术生态整合
跟踪国产GPU技术生态(如沐曦、昇腾、寒武纪、摩尔线程),制定算力集群与第三方框架(PyTorch、TensorFlow)的适配策略,输出兼容性验证文档。
设计跨平台算力调度系统(如Kubernetes+Slurm混合架构),优化资源利用率与任务排队效率。
4、全生命周期管理
制定产品Roadmap,把控从硬件选型、研发测试到量产交付的全流程,监控BOM成本与供应链风险(如国产GPU芯片供货周期)。
通过客户POC测试数据、运维日志分析,持续迭代产品性能与稳定性(如故障自愈、功耗动态调节功能)。
【任职要求】
1、本科及以上学历,人工智能、计算机等相关专业;
2、3年以上B端硬件产品经理经验,主导过AI服务器、算力集群或工业智能设备的产品落地,熟悉GPU/FPGA等加速卡技术栈。
3、跨团队协同能力,可高效对接硬件研发(PCB设计、散热方案)、算法团队(模型轻量化)与交付实施团队。
4、数据驱动思维,能通过运维埋点数据、集群负载率分析,量化产品优化方向
【优先项】
1、参与过国产AI芯片(如地平线、黑芝麻)的软硬件协同开发项目;
2、主导工业AI一体机产品定义,熟悉边缘计算设备(如Jetson AGX Orin)的部署瓶颈;
3、熟悉高性能计算(HPC)集群运维,掌握SLURM/Kubernetes调度器配置。
4、熟悉InfiniBand/RoCEv2网络调优,或GPU Direct RDMA技术;
5、了解工业协议(如OPC UA、Modbus)与AI推理框架(TensorRT、OpenVINO)的集成方案。