职位描述
【岗位职责】
1. 负责深度学习推理引擎的设计、开发与优化,基于 C/C++ 实现 TensorRT、ONNX Runtime 等引擎的集成与定制,支撑模型高效部署。
2. 衔接深度学习模型训练与推理环节,完成 PyTorch 等框架模型到推理引擎的适配、转换与调试,保障端到端链路顺畅。
3. 针对 CNN、目标检测、语义分割等模型,运用剪枝、蒸馏、量化等技术实现模型轻量化,平衡推理性能、内存占用与精度需求。
4. 负责推理系统的性能瓶颈分析与优化,结合 CPU/GPU 异构计算特性,提升模型推理速度与并发处理能力。
5. 参与深度学习相关算法的工程化落地,配合算法团队完成技术验证,输出规范的设计文档、接口文档及部署手册。
6. 跟踪推理引擎、模型优化等前沿技术,引入适配业务场景的技术方案,持续迭代优化推理系统性能。
【岗位要求】
1. 本科及以上学历,计算机、电子信息、自动化、人工智能等相关专业,1年以上深度学习推理引擎开发经验,具备扎实的工程实践能力与项目落地经验;有大规模推理系统搭建经验者优先。
2. 精通 C/C++ 语言,熟练掌握 C++11/17 标准特性、STL 容器与算法、模板编程等高级编程技巧,具备扎实的底层编程能力和问题排查能力,能熟练使用主流开发环境(VS、GCC等)开展工作。
3. 熟悉 PyTorch、Python 深度学习生态,熟悉 TensorRT、ONNX Runtime 等主流推理引擎的部署、优化与定制开发。
4. 熟悉模型训练、验证、部署等流程,理解训练过程对推理性能的影响。
5. 熟悉模型剪枝、蒸馏、量化(INT8/FP16等)等轻量化技术优先。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕