1.方案设计与开发:
(1)深入理解客户在人工智能计算(AI训练、推理、大模型应用)或云计算(云原生、混合云、私有云)领域的需求,提供专业的技术咨询与方案建议;
(2)基于公司云网融合的资源平台(云计算中心、边缘计算节点、超算/智算集群),设计符合业务场景的高可行性、高性价比的综合技术解决方案;
(3)撰写详细的技术建议书、解决方案文档、系统架构图、演示材料等;
(4)对AI场景深入理解模型训练集群架构、GPU调度、高性能存储、AI框架,对云场景深入理解IaaS/PaaS服务、云迁移策略、混合云架构等。
2.客户支持与交流:
3.招投标支持:
(1)负责大型项目招投标过程中的技术应答,独立或牵头完成投标技术文档(技术方案、配置清单、应答偏离表等)的编写;
4.市场洞察:持续跟踪AI计算及云计算领域的技术发展趋势、行业应用案例和市场格局变化。
任职要求:
1.计算机科学、软件工程、网络工程、通信工程、电子信息、人工智能或相关专业;
2.3年及以上AI计算(高性能计算/HPC、GPU集群、AI训练/推理平台)或云计算解决方案设计、售前技术支持相关工作经验,有大型云服务商、数据中心运营商、IT解决方案提供商相关工作经验者优先;
3.熟悉大模型集群基础设施、分布式训练框架(如PyTorch, TensorFlow)、高性能存储、GPU/NPU资源调度者优先(针对AI方向),对主流公有云平台、私有云技术(如OpenStack, VMware, K8s)有深入了解或实践经验者优先(针对云方向);
4.技术能力(至少在一个方向有深厚基础):
(1)AI计算方向:
深入理解AI训练/推理硬件(GPU/NPU/TPU)架构、集群组网(InfiniBand/RoCE),熟悉分布式训练原理,熟悉或了解高性能计算、并行存储(如Lustre, BeeGFS)相关概念;
(2)云计算方向:
精通IaaS、PaaS核心概念及主流技术(虚拟化、存储、网络、安全),深入理解容器技术(Docker)、容器编排(Kubernetes)及其生态系统,了解云原生应用设计理念和相关技术栈(微服务、DevOps、Service Mesh等);