职位详情
大模型开发
面议
中软国际
北京
1-3年
本科
04-28
工作地址

中海油能源研究院1号楼

职位描述
1.工程化落地与性能调优
o搭建大模型服务框架,熟悉HTTP接口设计,部署高并发、低延迟的模型服务。
o利用vLLM、Ollama等框架优化推理性能,探索量化、蒸馏等技术压缩模型规模。
o构建模型评估体系,设计自动化评测脚本,监控模型输出稳定性及安全性(如幻觉抑制)。
2.业务场景赋能
o与售前团队协作,针对审计领域需求,设计大模型应用方案(如制度问答,审计问题定性,审计文书生成)。
o熟练运用工具链与中间件,例如LangChain、LlamaIndex等框架实现复杂任务编排,结合向量数据库(如Milvus、Pinecone)优化检索效率。
3.大模型开发与优化
o负责大语言模型(LLM)的预训练、精调(SFT)、强化学习(RLHF)等流程开发,优化模型在问答、摘要、知识推理等场景的性能。
o应用LoRA、QLoRA等技术实现模型参数高效微调,结合业务需求适配开源模型(如LLaMA、GLM、Qwen等),减少资源消耗并提升推理效率。
o设计并实施RAG(检索增强生成)技术方案,优化端到端链路效果,提升知识密集型任务准确率。
任职要求
1.技术能力
o精通Python,熟悉PyTorch/TensorFlow框架,具备分布式训练及混合精度调优经验者优先。
o熟悉Prompt Engineering设计模式,具备多轮对话、角色扮演等交互式场景的调优经验。
o熟悉大模型生态工具链,包括但不限于Hugging Face、LLaMA Factory等。
o熟悉Linux操作系统,掌握基础运维及性能调优命令(如Shell脚本、资源监控)
o理解网络基础(如HTTP协议、RESTful API设计、高并发服务架构),具备服务部署及调试经验。
o熟悉数据库技术,包括关系型数据库(如MySQL)和NoSQL数据库(如MongoDB),了解向量数据库的应用场景。
o了解前后端开发框架(如Django/Flask、React/Vue),能够协作完成服务接口联调及轻量化前端开发。
2.经验要求
o3年以上NLP/或1年以上大模型研发经验,完整参与过至少一个LLM项目的训练或落地应用者优先。
o有金融、政务、审计等领域AI项目经验者优先。
o熟悉华为昇腾生态(如MindSpore、ModelArts)或云计算平台集成经验者优先。
o具备基于通用技术栈(如Linux服务器部署、数据库优化、前后端协作)的工程化落地经验者优先
3.团队能力素质
o能力独立实施大模型工程类项目者优先。
o具备团队协作能力,能将复杂技术问题转化为可落地的业务解决方案者优先。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请