面议
漕河泾科技绿洲-四期3号楼
职位描述:我们正在寻找一位经验丰富的AI模型工程化工程师,负责将深度学习模型高效地部署到生产环境中,并优化其性能。理想的候选人应具备扎实的C++编程能力,熟悉深度学习模型推理优化技术(如ONNX、TensorRT)、Batch推理和算子优化等。并对点云、Mesh等3D数据处理算法有深入理解。您将与算法团队、产品团队紧密合作,推动AI技术在实际应用中的落地。
工作职责1. 负责深度学习模型的工程化落地,包括模型转换、量化、推理优化及部署。
2. 使用ONNX、TensorRT等工具对模型进行优化,提升推理性能并降低资源消耗。
3. 针对点云、Mesh等3D数据,设计和实现高效的预处理、后处理算法。
4. 开发和维护高性能的C++推理引擎,确保其在GPU上的稳定运行。
5. 与算法团队协作,理解模型需求并提供工程化支持,确保模型从训练到部署的无缝衔接。
6. 持续优化现有系统,解决性能瓶颈,提升系统的可扩展性和鲁棒性。
7. 编写高质量的技术文档,分享最佳实践,推动团队技术能力的提升。
任职要求
· 必备技能:
1. 5年以上C++开发经验,熟悉现代C++特性(C++11/14/17)。
2. 熟悉深度学习模型推理优化技术,如ONNX、TensorRT、OpenVINO等。
3. 了解模型推理加速的研究和技术进展,包括但不限于模型量化、剪枝、TensorRT优化、Flash Attention 推理优化等;
4. 熟悉深度学习框架(如PyTorch、TensorFlow),了解模型训练与推理的基本流程。
5. 熟悉 TensorFlow/PyTorch 模型的训练和部署,了解混合精度训练、分布式训练等训练加速方法优先。
6. 对点云(Point Cloud)、Mesh等3D数据处理算法有实际项目经验。
7. 熟悉多线程编程、内存优化及高性能计算技术。
8. 具备良好的代码风格和工程化能力,熟悉CI/CD流程及版本控制工具(如Git)。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕