职位详情
【快Star-X】大模型推理/训练优化工程师
面议
北京达佳互联信息技术有限公司
杭州
无经验
硕士
06-25
工作地址

快手公司

职位描述
职位描述:
1、参与大模型推理/训练优化。通过研发业界领先的AI Compiler 技术,支撑搜推场景在GPU上的训练计算性能优化;支持大模型推理优化技术在异构硬件上的落地;
2、参与各种大模型推理所需的功能性开发任务;相关编译优化功能开发,以图优化、算子融合、GPU高性能算子开发及自动Codegen等技术手段不断推高在不同卡型上的计算性能极限;
3、参与支持日常的大模型推理服务部署,参与内部日常提效工具的研发。
任职要求:
1、硕士及以上学历,计算机、电子、自动化等专业优先;
2、熟悉python/C++,熟悉linux使用,有扎实的算法与数据结构基础;
3、有较强的自驱力和学习力,有严谨的科研思维,沟通良好擅长与人合作;
4、了解AI infra 整体技术栈,有大模型相关训练或推理优化实战经验;有vLLM、TensorRT-LLM、MLC-LLM、Tensorflow、PyTorch等框架之一的实践经验。

加分项:
1、熟悉CUDA 或 ROCM,熟悉Nsight System/ Nsight Compute 工具的使用,有 GPU 或 ASIC 高性能算子开发经验;
2、熟悉深度学习编译优化或异构硬件,有 XLA/ TVM /MLIR 开发、优化经验,熟悉pass编写或代码生成原理和实践;或有传统编译器开发经验,熟悉LLVM原理和使用;
3、有相关领域顶会paper发表;
4、有二次开发能力或开源社区贡献经历。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

在线网申