职位详情
大模型系统部署与优化工程技术岗(FXQ26)
面议
江淮前沿技术协同创新中心
合肥
1-3年
硕士
04-16
工作地址

中安创谷科技园二期-H6栋

职位描述
岗位职责:
1.负责大模型在云端或边缘设备上的部署与优化,使用Docker 进行容器化部署,结合 ​TensorRT或ONNX Runtime进行模型优化,确保高效推理和资源利用;
2.设计和实现大模型的分布式推理框架,支持高并发、低延迟的场景需求;
3.结合硬件(Nvidia、昇腾GPU,NPU,VPU,IPU等)特性进行模型推理加速,优化部署性能;
4.监控和调优模型部署后的性能,解决实际运行中的瓶颈问题;
5.编制相关技术文档,确保部署流程的可复现性和可维护性;
6.完成主管领导交办的其他工作。
任职条件:
1.学历: 硕士研究生及以上;
2.专业: 计算机、自动控制、人工智能、机器人等相关专业;
3.经验及行业背景: 2年以上相关工作经验;
4.特殊要求(知识、技能等):
(1)深入理解深度学习的基本原理,熟悉主流神经网络架构(如Transformer、CNN、GRU、SNN等),精通模型的训练与推理流程;
(2)了解GPU、TPU、VPU、AI芯片等硬件加速技术,熟悉CUDA、OpenCL等编程模型;
(3)熟悉TensorRT、ONNX Runtime、TVM等推理引擎,能够优化模型在特定硬件上的推理性能;
(4)参与过大模型部署与优化的实际项目经验者优先;
(5)具有较强的责任心、良好的沟通能力、组织协调能力与执行力。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请