职位描述
1、在J6M、Orin等算力平台,使用ONNXRuntime和TensorRT对模型进行量化、剪枝和编译优化,
以最大化推理性能。
2、解决模型转换和部署过程中遇到的各种技术挑战,如算子兼容性、精度损失等问题。
3、编写高效、稳定的推理代码,并进行性能测试和瓶颈分析。
4、与算法团队紧密合作,共同改进模型结构,使其更适合边缘计算设备的部署。
任职要求:
1、本科及以上学历。
2、精通Python和C++,有实际项目开发经验
3、熟悉ONNX、TensorRT、OpenVINO等模型部署工具
4、有深度学习模型部署经验,包括模型转换、量化、压缩等
5、良好的沟通能力和团队协作精神
加分项
1、熟悉视觉感知模型
2、有自动驾驶行业经验
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕