职位描述
工作职责
负责深度学习模型的工程化落地,包括模型转换、量化、推理优化及部署。
使用ONNX、TensorRT等工具对模型进行优化,提升推理性能并降低资源消耗。
针对点云、Mesh等3D数据,设计和实现高效的预处理、后处理算法。
开发和维护高性能的C++推理引擎,确保其在GPU上的稳定运行。
与算法团队协作,理解模型需求并提供工程化支持,确保模型从训练到部署的无缝衔接。
持续优化现有系统,解决性能瓶颈,提升系统的可扩展性和鲁棒性。
编写高质量的技术文档,分享最佳实践,推动团队技术能力的提升。
任职要求
必备技能:
5年以上C++开发经验,熟悉现代C++特性(C++11/14/17)。
熟悉深度学习模型推理优化技术,如ONNX、TensorRT、OpenVINO等。
了解模型推理加速的研究和技术进展,包括但不限于模型量化、剪枝、TensorRT优化、Flash Attention 推理优化等;
熟悉深度学习框架(如PyTorch、TensorFlow),了解模型训练与推理的基本流程。
熟悉 TensorFlow/PyTorch 模型的训练和部署,了解混合精度训练、分布式训练等训练加速方法优先。
对点云(Point Cloud)、Mesh等3D数据处理算法有实际项目经验。
熟悉多线程编程、内存优化及高性能计算技术。
具备良好的代码风格和工程化能力,熟悉CI/CD流程及版本控制工具(如Git)。
加分项:
熟悉CUDA编程,能够编写高性能的GPU加速代码。
了解计算机图形学(Computer Graphics)相关算法,如渲染、几何处理等。
有实际项目中使用PCL(Point Cloud Library)、Open3D等点云处理库的经验。
对AI模型量化、剪枝、蒸馏等压缩技术有深入理解和实践。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕