职位详情
大模型推理加速工程师(拔尖计划)
面议
中移金科
北京
5-10年
硕士
06-19
工作地址

博瑞琪大厦

职位描述
岗位职责:
1、大模型推理开发:负责大模型的服务化工作,包括模型部署、模型服务开发,以维护和更新;
2、训练与推理加速:负责大模型的训练与推理加速工作,利用裁剪、量化、蒸馏等技术,加速及优化模型的推理效率,提升吞吐量,并解决推理性能瓶颈。
任职资格:
1、硕士研究生及以上学历,计算机及相关专业,具备五年以上相关工作经验;
2、编程语言与技能‌:精通C++、Python、Go等编程语言,熟悉CPU/GPU架构与工作原理,有深度学习系统研发经验,熟悉CUDA编程;
3、深度学习框架:熟悉主流深度学习框架如PyTorch、TensorFlow、PaddlePaddle等‌;
4、大模型加速优化工作经验:具有量化、剪枝、蒸馏等模型推理加速优化的工作经验者优先;掌握AI加速技术如TensorRT、TVM、VLLM等工作经验者优先;
5、其他:具备快速学习能力和团队合作精神。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请