任职资格:
1.研究生及以上学历(计算机科学与技术、信息与通信工程、电子科学与技术、软件工程、交通运输工程、含相关学位的专业或方向);
2.三年及以上工作经验;
3.英语6级(CET-6)或同等水平以上;
4.具备三年以上计算机自然语言、视觉或多模态生成等相关领域模型训练、推理部署等工作经验;
5.熟悉深度学习大模型相关主要工具和主流经典AI模型,如BERT、GPT、ViT、CLIP或Stable Diffusion、deepseek等;
6.熟悉模型预训练和调优过程,了解模型量化、蒸馏等模型轻量化技术,以及推理部署参数调优技术;
7.掌握Python语言,熟悉Flask,FastAPI等Python主要框架;熟悉Linux开发环境;熟悉Pytorch、TensorFlow、MindSpore等深度学习框架;
8.良好的英文阅读能力,强烈的人工智能领域新知识学习兴趣;
9.有交通运输类、金融类大模型建设经验者优先;
10.身体健康,吃苦耐劳,有创新精神。
岗位概述:
1.负责主流模型在服务器上的部署;能够进行大量数据的向量化处理,符合RAG需要;
2.构建自动化模型推理部署技术流程,开发相关系统;
3.开展模型量化、蒸馏等模型小型化技术,以及推理相关参数优化技术的研究;
4.根据实际应用场景,参与大模型全流程的研发工作,包括客户需求分析、系统方案设计、数据处理、算法模型设计、模型开发、训练、部署、调试、评测、业务联合调试等;
5.掌握大模型的优化技术,掌握基本的处理数据稀疏问题和长距依赖问题的办法;
6.积极探索和跟进技术前沿方向,在实际业务场景落地并沉淀通用的算法能力或解决方案;
7.公司安排的其他事项。
8.此岗位为劳务派遣合同。