岗位描述
该岗位负责基于公司生产的 AI 硬件开发和部署 AI 模型,进行模型量化和加速,提升模型的推理性能。
工作内容
- 结合 AI 硬件,编写典型场景全流程 Demo,包括模型训练、量化、编译、部署、推理等;
- 使用 TPU-MLIR 等编译器,将深度学习模型高效地映射到 TPU 中运行;
- 移植主流或客户的算法模型,为客户提供典型场景通用技术解决方案;
- 支持客户完成算法移植工作,收集反馈问题和需求,并提出改进意见。
任职要求
- 2 年以上工作经验,扎实的编程基础,良好的编程风格;
- 熟悉 Python 的常用库和工具,如 NumPy、Pandas、Scikit-learn 等;
- 熟悉 Caffe/TensorFlow/MxNet/PyTorch 等至少一种深度学习框架;
- 熟悉图像分类、目标检测及跟踪、图像分割、自然语言处理等常见深度学习算法;
- 有主流 LLM GPT 开源衍生模型(Alpaca, LLaMA, Vicuna, Lora 等)的使用经验;
- 有 NPU/TPU 等硬件加速器的使用经验,有模型量化和加速的经验;
- 有 TPU-MLIR 等编译器的使用经验,有移植模型到 TPU 的经验;
- 有基本的英文文档读写能力;
- 有良好的工作习惯和职业素养。
加分项
- 熟悉编译器基本知识,了解至少一种通用或者专用的编译器,如 GCC、LLVM、TVM、MLIR 或者自研编译器等;
- 熟悉图像和音视频相关基本知识,有 FFmpeg、OpenCV、gstreamer 等开发经验;
- 有开源社区贡献或者开源项目。