岗位职责:
 1、大模型推理开发:围绕公司核心AI产品,如AI+实名认证、AI+深度鉴伪、AI+风险目标审核、AI+视觉文档风控等,负责大模型的服务化工作,包括模型部署、模型服务开发,以维护和更新; 
2、训练与推理加速:负责大模型的训练与推理加速工作,利用裁剪、量化、蒸馏等技术,加速及优化模型的推理效率,提升吞吐量,并解决推理性能瓶颈。
 任职资格:
 1、硕士研究生及以上学历,计算机及相关专业,具备五年以上相关工作经验; 
2、编程语言与技能:精通C++、Python、Go等编程语言,熟悉CPU/GPU架构与工作原理,有深度学习系统研发经验,熟悉CUDA编程; 
3、深度学习框架:熟悉主流深度学习框架如PyTorch、TensorFlow、PaddlePaddle等; 
4、大模型加速优化工作经验:具有量化、剪枝、蒸馏等模型推理加速优化的工作经验者优先;掌握AI加速技术如TensorRT、TVM、VLLM等工作经验者优先 
5、其他:具备快速学习能力和团队合作精神。