职位详情
大模型优化部署
2.5-4.5万·13薪
深圳市科思科技股份有限公司
深圳
3-5年
本科
05-14
工作地址

中航工业南航大厦5f

职位描述

关键信息:

1. 具备算子开发与调优经验。至少熟悉一种国产芯片(昇腾、瑞芯微、天数、寒武纪)及配套开发工具链(CANN、BANG语言)。

2. 了解国产AI框架的模型迁移与部署流程。

3. 2年以上AI模型部署或高性能计算(HPC)经验,至少参与过一个完整的大模型落地项目。熟悉大模型架构(Transformer、MoE等)。

4. 有AI模型在Linux嵌入式设备或分布式集群的部署经验,熟悉Docker/K8s等容器化技术。

5. 计算机、电子工程、数学等相关专业本科及以上学历。

岗位职责:

负责大模型在云端、边缘端及国产化算力平台(如华为昇腾、寒武纪等)的部署适配与落地应用;

针对不同硬件架构和AI推理卡,设计高效的推理部署方案,确保模型兼容性与性能最优;

分析大模型算子的硬件适配瓶颈,优化计算图拆分、内存分配及通信策略,提升模型推理速度与资源利用率;

熟悉国产芯片(如昇腾910、海光DCU、飞腾等)及操作系统(麒麟、统信UOS),解决软硬件协同优化问题;

撰写技术文档,输出国产化平台适配与性能优化技术文档。

招聘要求:

精通PyTorch/TensorFlow等框架,熟悉大模型架构(Transformer、MoE等);

具备算子开发与调优经验,熟悉主流加速库(如DeepSpeed、vLLM);

至少熟悉一种国产芯片(昇腾、海光、寒武纪)及配套开发工具链(CANN、BANG语言);

了解国产AI框架的模型迁移与部署流程;

有AI模型在Linux嵌入式设备或分布式集群的部署经验,熟悉Docker/K8s等容器化技术;

2年以上AI模型部署或高性能计算(HPC)经验,至少参与过一个完整的大模型落地项目;

计算机、电子工程、数学等相关专业本科及以上学历,硕士优先。

加分项:

参与过国产化AI软硬件生态建设项目(如信创项目);

熟悉大模型并行训练技术(数据并行、流水线并行、张量并行);

有AI编译器(TVM、MLIR)或异构计算开发经验;

发表过AI系统优化相关论文或开源项目贡献者。

备注:6月搬到深圳市南山区粤海街道高新区社区科苑南路3156号深圳湾创新科技中心2栋

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请