职位描述
岗位职责:
●边缘模型部署与集成: 负责将训练好的计算机视觉模型( PyTorch,TensorFow, ONNX等)高效、稳定地部署到自研的AI芯片.上,实现从算法到产品的落地。
●边缘端性能极致优化:针对自研soC的NPU、GPU、 CPU异构算力,进行模型算子适配、内存优化和并行计算优化,最大化利用硬件资源。
●应用模型压缩技术(量化INT8/FP16、剪枝、知识蒸馏)显著降低模型体积和计算量,满足边缘设备在算力、内存、功耗和时延上的严格约束。●推理引擎与工具链开发:熟练运用或二次开发适用于边缘设备的推理框架,如RKNN Toolkit 1 RKNN-Toolkit2 (针对RK3588), M indSpore Lite 或Ascend参考应用(针对异腾)。
●开发自动化脚本或工具 :实现模型转换、量化、编译、测试的流水线化,提升部署效率。
●服务封装与系统集成: 将优化后的模型封装为轻量级服务或 SDK,集成到嵌入式Linux系统或上层应用中,提供低延迟、高可靠的推理接口。
●性能监控与问题排查: 在真实边缘设备上建立性能监控,持续跟踪推理延迟、帧率(FPS)、 功耗、温度等关键指标,快速定位并解决部署中的性能瓶颈和稳定性问题。
●跨团队协作: 与算法团队紧密合作, 指导模型设计以适应边缘部署;与嵌入式开发、硬件团队协作,解决底层驱动、资源调度等问题。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕