1、负责端到端(E2E)智驾算法(感知 / 规控/VLM/VLN等)的工程化部署,主导从模型到生产环境(端侧 / 边缘端 / 云端)的全流程落地;
2、参与 E2E 模型优化,包括压缩、量化、蒸馏、算子优化,解决低延迟、高算力效率、内存占用等部署核心问题;
3、搭建 E2E 算法部署流水线,开发模型转换(如 ONNX/TensorRT)、推理引擎集成、性能测试等自动化工具;
4、适配不同硬件平台(CPU/GPU/ASIC/FPGA),优化 E2E 模型在目标硬件上的推理性能,保障部署稳定性;
5、与算法团队协作,输出部署性能需求,推动模型设计阶段的工程化适配(如轻量化架构选型);
任职要求:
1、计算机 / 电子信息 / 自动化等相关专业本科及以上学历,3年 + 算法部署或深度学习工程化经验,熟悉 E2E 算法落地全流程。
2、精通模型优化技术(剪枝 / 量化 / 蒸馏),熟练使用 TensorRT/ONNX Runtime/MNN 等推理引擎,掌握 C++/Python 编程。
3、具备硬件适配能力,熟悉至少一种硬件平台(如 NVIDIA Jetson、地平线征程、Mobileye 等)的部署优化方法。
4、有 E2E 感知 / 规划模型部署落地经验(如自动驾驶、智能安防场景),能独立解决部署中的性能瓶颈问题。
5、了解分布式推理、云原生部署(Docker/K8s),具备自动化部署工具开发经验者优先。
6、具备较强的问题排查能力与跨团队协作意识,能快速响应部署需求,跟进技术迭代。