职位详情
科创二十所智能运维/Al推理框架工程师
面议
中车科技创新(北京)有限公司-中车科技创新(北京)有限公司
北京
无经验
博士
09-18
工作地址

北京

职位描述
岗位职责:

1.开展大模型推理引擎、CTR推理引擎、端推理引擎的开发和优化:开展大规模稀疏分布式模型、LLM大语言模型、图像/视频生成模型、端计算推理引擎,以及CPU/GPU/国产NPU高性能推理等的研发和优化



任职要求:

1.精通C++/Python 高性能编程,掌握 TensorRT/ONNX Runtime/vLLM 等推理引擎开发,具备量化、剪枝、动态批处理等模型加速技术实战经验。
2.熟悉 LLM大语言模型(如Transformer架构)、图像/视频生成模型、CTR预估模型的推理优化,能针对CPU/GPU/NPU异构平台进行性能调优。
3.具备端到端推理系统落地能力,覆盖云端(分布式推理调度、K8S服务化部署)、端侧(TensorFlow Lite/ONNX Runtime Mobile轻量化适配),并实现高并发、低延迟、高吞吐的工业级需求。
4.掌握MLIR/TVM/Triton等编译优化工具,拥有显存管理、算子融合、安全合规等深度优化能力;具备跨团队协同(算法+硬件+运维)落地经验,对疏计算、端云协同等前沿方向保持技术敏锐度。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请