岗位职责:
1. 同算法团队合作进行高质量的算法pipeline设计优化;
2. 深度学习模型嵌入式ARM+NPU 异构架构上的量化、剪枝、蒸馏压缩,保障精度与效率的均衡;
3. 实现特定算子自定义及优化,推理引擎适配及性能提升 ;
4. 工具链的二次开发和部署落地。
任职要求:
1. 精通 C/C++编程(5年以上开发优化经验),精通高性能计算优化(SIMD 指令集、内存对齐),具备 TensorFlow Lite/ONNX Runtime 等推理引擎定制开发经验;
2. 熟悉常用计算机视觉算法(立体视觉算法优先),嵌入式端侧优化,熟练掌握模型量化、稀疏化、算子融合等技术;
3. 深入理解 ARM Cortex-A/R 系列、CEVA DSP 或 Cadence Tensilica 处理器架构,具备异构计算(CPU+NPU+GPU)任务调度经验;
4. 有车规级芯片及机器人芯片平台(如地平线、Orin、瑞芯微等)部署经验优先;
5. 良好的团队合作能力。