1.2-2万
中航工业南航大厦5f
关键信息:
1. 具备算子开发与调优经验。至少熟悉一种国产芯片(昇腾、瑞芯微、天数、寒武纪)及配套开发工具链(CANN、BANG语言)。
2. 了解国产AI框架的模型迁移与部署流程。
3. 2年以上AI模型部署或高性能计算(HPC)经验,至少参与过一个完整的大模型落地项目。熟悉大模型架构(Transformer、MoE等)。
4. 有AI模型在Linux嵌入式设备或分布式集群的部署经验,熟悉Docker/K8s等容器化技术。
5. 计算机、电子工程、数学等相关专业本科及以上学历。
岗位职责:
负责大模型在云端、边缘端及国产化算力平台(如华为昇腾、寒武纪等)的部署适配与落地应用;
针对不同硬件架构和AI推理卡,设计高效的推理部署方案,确保模型兼容性与性能最优;
分析大模型算子的硬件适配瓶颈,优化计算图拆分、内存分配及通信策略,提升模型推理速度与资源利用率;
熟悉国产芯片(如昇腾910、海光DCU、飞腾等)及操作系统(麒麟、统信UOS),解决软硬件协同优化问题;
撰写技术文档,输出国产化平台适配与性能优化技术文档。
招聘要求:
精通PyTorch/TensorFlow等框架,熟悉大模型架构(Transformer、MoE等);
具备算子开发与调优经验,熟悉主流加速库(如DeepSpeed、vLLM);
至少熟悉一种国产芯片(昇腾、海光、寒武纪)及配套开发工具链(CANN、BANG语言);
了解国产AI框架的模型迁移与部署流程;
有AI模型在Linux嵌入式设备或分布式集群的部署经验,熟悉Docker/K8s等容器化技术;
2年以上AI模型部署或高性能计算(HPC)经验,至少参与过一个完整的大模型落地项目;
计算机、电子工程、数学等相关专业本科及以上学历,硕士优先。
加分项:
参与过国产化AI软硬件生态建设项目(如信创项目);
熟悉大模型并行训练技术(数据并行、流水线并行、张量并行);
有AI编译器(TVM、MLIR)或异构计算开发经验;
发表过AI系统优化相关论文或开源项目贡献者。
备注:6月搬到深圳市南山区粤海街道高新区社区科苑南路3156号深圳湾创新科技中心2栋
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕