职位详情
AI算力优化工程师(大模型方向)
2-4万
上海汇智优才数字科技有限公司
北京
3-5年
硕士
07-11
工作地址

中电信人工智能科技(北京)有限公司

职位描述
岗位要求:
1. 基础要求
- 计算机/电子工程/人工智能相关专业,硕士及以上学历
- 3年以上AI算力基础设施或大模型部署优化经验
2. 算力工程能力
- 精通 GPU/昇腾910B等AI芯片特性,具备集群部署经验。
- 熟悉 Kubernetes/Docker容器化部署及InfiniBand/RoCE高性能网络调优。
3. 模型优化能力:
- 出色的编程能力, 数据结构及算法功底, 熟悉Python或C++高性能编程
- 熟悉至少一种主流深度学习编程框架(PyTorch/Tensorflow/Caffe)
- 熟悉常用的LLM应用框架(Langchain, llamaindex等)的设计思路和使用
- 掌握大模型量化压缩技术,并对分布式训练框架(Megatron/DeepSpeed)有过原理及代码级的了解
岗位职责:
1. 智算基础设施部署与优化
- 负责AI算力硬件(GPU/NPU集群)及PaaS平台的规模化部署、组网架构设计与性能调优(如RDMA网络优化)
- 主导算力交付的可用性评测,制定性能基线指标并输出优化方案
2. 大模型算力选型与适配
- 结合业务场景需求(如训练/推理时延、吞吐量、成本),为千亿级大模型(如DeepSeek 67B/130B)提供算力架构选型建议(芯片类型/集群规模)及模型精度策略(FP8/BF16/INT8量化)
- 对主流开源模型(LLaMA、ChatGLM、DeepSeek等)进行算力适配优化,包括算子融合、编译优化、显存压缩等技术落地
3. 算力使用及性能瓶颈优化
- 分析算力不足或模型性能瓶颈根因,指导并参与应用层服务优化或数智中台功能升级(如自动弹性伸缩、资源调度策略), 指导并参与实施性能优化方案

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请