职位描述
职位描述
1、参与研发业界领先的深度学习编译技术,落地计算优化、显存优化及分布式优化技术到训练框架和推理框架中,赋能深度学习算法落地;
2、XLA 相关编译优化功能开发;
3、结合pytorch/tensorflow等上下游框架适配与集成;
4、异构大模型推理引擎优化,负责调研NV 上各种推理引擎的优化技术,并支持大模型推理各种优化技术在异构硬件上的落地。
任职要求
1、硕士及以上学历,专业不限,计算机相关专业优先;
2、了解AI infra 整体技术栈需求,有训练框架或推理框架实战经验、熟悉Tensorflow 或 PyTorch 的使用、有二次开发能力或开源社区贡献经历更佳;
加分项:
1、有大模型相关训练或推理优化经验或GPU 高性能算子开发经验;有vLLM、TensorRT-LLM、MLC-LLM 等框架之一的实践经验;
2、熟悉深度学习编译优化或异构硬件,有 XLA/ TVM /MLIR 开发、优化经验,熟悉pass编写或代码生成原理和实践;或有传统编译器开发经验,熟悉LLVM原理和使用;?4、实习时长3个月及以上, 优先长期实习。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕