职位详情
大模型应用开发工程师
2.5-5万
松延动力(北京)科技有限公司
北京
3-5年
本科
09-15
工作地址

北京昌平区北七家街道天宣街未来星科低碳产业园4号楼3楼

职位描述
岗位职责
1、负责大模型数据清洗、大模型训练微调、RAG系统开发、大模型服务线上部署。熟练掌握主流大模型和多模态大模型的预训练、微调及部署的细节和原理。能够紧密结合公司应用场景,准备相关数据,对模型进行针对性微调,提升大模型在垂域场景效果,并在服务器上部署上线。
2、开发基于 RAG(检索增强生成)的多模态服务框架,支持文本、图形、音视频等模态的检索和生成,整合知识库检索与模型生成能力,大幅提高生成内容的准确性与上下文关联性,为用户提供更具价值的信息。
构建先进的多模态智能体系统,无缝集成知识库检索、Agent 工具链调用以及多模态交互(文本 / 语音 / 图像)等关键功能,满足多样化的业务需求。
3、积极探索模型剪枝、量化、知识蒸馏等轻量化技术,有效降低推理成本,提升模型在实际应用中的运行效率。

任职资格
1、统招本科及以上学历,理工科类专业背景,计算机、电子工程、自动化、机电相关专业,3年以上相关工作经验。
2、熟练掌握 Python 编程语言、常用机器学习框架(如 TensorFlow、PyTorch)和大模型训练框架(如Fairseq/ms-swift/megatron-lm),能够运用这些工具进行高效的模型开发与实验。
3、掌握 LangChain 、LLamaIndex或Ragflow等RAG框架,熟悉向量库技术(如 Milvus、Faiss、Weaviate)和ElasticSearch、Neo4j等相关工具,基于相关框架进行开发集成和功能实现。
4、熟练掌握vllm/llama.cpp/SGLang/lm-deploy等大模型推理框架,具备基于相关工具进行推理服务集成能力。有工程化能力和性能优化能力。
具有全流程(即大模型数据清洗、大模型训练微调、RAG系统开发、大模型服务部署)的经验。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请