职位详情
C++推理引擎工程师(高级)
1.8-2.5万
湖南三岳数维科技有限公司
北京
5-10年
本科
01-26
工作地址

东方梅地亚中心-C座 2209

职位描述
【岗位职责】
1. 负责深度学习推理引擎的设计、开发与优化,基于 C/C++ 实现 TensorRT、ONNX Runtime 等引擎的集成与定制,支撑模型高效部署。
2. 衔接深度学习模型训练与推理环节,完成 PyTorch 等框架模型到推理引擎的适配、转换与调试,保障端到端链路顺畅。
3. 针对 CNN、目标检测、语义分割等模型,运用剪枝、蒸馏、量化等技术实现模型轻量化,平衡推理性能、内存占用与精度需求。
4. 负责推理系统的性能瓶颈分析与优化,结合 CPU/GPU 异构计算特性,提升模型推理速度与并发处理能力。
5. 参与深度学习相关算法的工程化落地,配合算法团队完成技术验证,输出规范的设计文档、接口文档及部署手册。
6. 跟踪推理引擎、模型优化等前沿技术,引入适配业务场景的技术方案,持续迭代优化推理系统性能。
【岗位要求】
1. 本科及以上学历,计算机、电子信息、自动化、人工智能等相关专业,3年以上深度学习推理引擎开发经验,具备扎实的工程实践能力与项目落地经验;
2. 精通 C/C++ 语言,熟练掌握 C++11/17 标准特性、STL 容器与算法、模板编程等高级编程技巧,具备扎实的底层编程能力和问题排查能力,能熟练使用主流开发环境(VS、GCC等)开展工作。
3. 有大规模推理系统架构经验;
4. 掌握 TensorRT、ONNX Runtime 等主流推理引擎的部署、优化与定制开发,能熟练完成模型从训练框架到推理引擎的适配与落地。
5. 掌握模型训练、验证、部署全流程,理解训练过程对推理性能的影响,可针对性优化端到端链路效率。
6. 掌握模型剪枝、蒸馏、量化(INT8/FP16等)等轻量化技术,能结合端侧/云端推理场景制定合理方案。
7. 熟悉 PyTorch、Python 深度学习生态;
8. 熟悉深度学习核心原理,熟悉卷积神经网络(CNN)、迁移学习、目标检测、语义分割、目标跟踪、姿态识别、多模态融合及小样本学习等方向,具备相关算法的工程化落地经验。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请