职位描述
岗位职责
基于英伟达A100、华为昇腾910B等GPU硬件平台,完成AI应用的部署优化与二次开发,保障大模型及业务算法在异构计算环境下的高效运行;
使用TensorFlow/PyTorch等框架实现业务场景算法模块开发,并结合GPU架构特性(如CUDA、MindSpore)进行性能调优,提升模型训练与推理效率;
结合LLaMA/GLM等大模型及RAG技术,构建基于GPU加速的检索增强生成系统,负责模型微调和算力资源调度优化;
开发面向GPU集群的工作流自动化工具,优化MCP框架在A100/910B平台的部署流程,提升大规模模型训练与推理的工程化落地效率;
输出GPU环境下的标准化技术文档、API接口文档及算力资源配置指南;
与跨职能团队协作,推动大模型技术在A100/910B硬件平台的产品化落地,主导技术创新与业务场景结合;
持续跟踪GPU加速计算、异构计算架构及AI领域最新进展,结合业务需求提出基于硬件特性的创新解决方案。
任职要求
5年以上AI应用开发经验,其中2年以上基于英伟达A100或华为昇腾910B平台的部署/调优经验,完整参与过至少2个大规模AI项目的全生命周期(从算法研发到硬件落地);
熟悉GPU架构特性,掌握CUDA编程、TensorRT/MindStudio模型优化工具,能独立完成模型在A100/910B上的性能调优(如算子优化、内存管理、并行计算调度等);
精通TensorFlow/PyTorch等深度学习框架,具备大模型(如LLaMA、GLM)微调和分布式训练经验,熟悉LoRA/P-Tuning等参数高效微调技术;
熟悉Diffy等低代码平台,能基于GPU环境完成AI应用的本地化部署、权限配置及插件开发,具备工作流编排实战经验;
掌握Prompt工程优化、知识库对接及向量数据库(Milvus/Pinecone)应用,有RAG系统构建经验者优先;
具备良好的工程化思维,能独立设计并开发GPU集群管理工具或自动化脚本,提升算力资源利用率;
加分项:
有电力设备数据分析、故障预测等垂直领域经验,或基于A100/910B的行业解决方案落地案例;
熟悉华为昇腾生态(如Atlas系列硬件、MindSpore框架)或英伟达AI Enterprise套件;
发表过GPU加速计算、大模型工程化相关技术论文或专利。
其他信息
团队氛围:技术驱动型团队,专注AI大模型工程化落地,提供行业前沿硬件资源与技术支持;
发展空间:参与核心项目研发,接触A100/910B等高端算力资源,可独立主导技术方向与架构设计。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕