1.负责AI模型在边缘设备(嵌入式/车路协同/移动端/自动驾驶车辆)的部署落地,构建跨平台统一部署框架
2.基于开源推理框架进行二次开发,实现模型的快速移植与部署
3.开发通用化部署工具链,支持PyTorch/TensorRT等主流训练框架到边缘推理框架的自动化转换
4.设计跨平台抽象层,实现"一次开发,多端部署"的目标,覆盖Android/iOS/Linux/嵌入式系统等平台
5.实施模型轻量化处理(量化/剪枝/蒸馏),平衡模型精度与推理效率
6.搭建性能评估体系,监控端侧推理时延、内存占用等关键指标
7.编写标准化部署文档和技术方案,输出可复用的部署组件库
【任职要求:必备条件】
1.本科及以上计算机科学相关领域教育背景
2.熟练掌握C++11以后标准,具备扎实的多线程、内存管理、异构计算及跨平台开发经验
3.熟悉ROS、Cyber RT、MQTT以及websock等中间件和通信协议。
4.熟悉至少两种主流端侧推理框架(如TFLite、MNN、NCNN、ONNXRuntime)
5.有NVIDIA Jetson、RK3588或树莓派开发经验。
6.熟悉Linux/Docker开发环境,掌握CMake/Bazel/交叉编译等构建工具
【加分项:优先条件】
1.熟悉模型量化技术(INT8/FP16)及相应工具
2.了解边缘设备硬件加速方案(NPU/GPU/DSP异构计算)
3.有边缘-云协同部署架构设计经验
4.具有ARM架构开发经验,了解NEON指令集基础优化方法