职位详情
大模型应用开发工程师
1.2-2.4万·13薪
北京首通智城科技创新有限责任公司
北京
3-5年
本科
10-31
工作地址

北京市-通州区-安顺路223号

职位描述
(一)岗位职责
1、负责大语言模型(LLM)相关前沿技术的研发以及落地工作,包括模型部署、优化和应用开发;
2、负责制定企业级AI大模型应用解决方案,建立相应的模型管理和监控机制,开展模型性能监控及优化,确保模型服务的稳定性和高可用性;
3、负责大模型推理框架(vLLM、TGI、Triton等)的部署和优化,负责AI应用架构、API接口、模型调用方式的设计和实现;
4、负责RAG(检索增强生成)应用的自主研发和建设,包括向量数据库选型、知识库构建、检索策略优化及prompt工程等;
5、负责识别和解决模型应用中的潜在问题,包括但不限于性能瓶颈、准确率优化、成本控制等,并推动相关技术手段建设;
6、熟悉AI应用全生命周期管理相关要求,建设和优化模型训练、部署、监控、迭代的能力体系。

(二)任职资格
1、本科及以上学历,计算机、人工智能、机器学习、数据科学等相关专业,3年以上工作经验;
2、熟悉vLLM、LangChain、LlamaIndex等大模型推理和应用开发框架,有大规模模型部署或应用开发经验;
3、熟悉RAG技术栈,包括向量数据库(Milvus、Qdrant、Chroma等)、Embedding模型、文档解析等;
4、掌握Python、Java等常见开发语言,熟练掌握PyTorch,熟悉FastAPI、Flask等Web框架;
5、熟悉主流大语言模型(ChatGPT、Claude、Deepseek、Qwen等),有AI Agent、prompt工程、模型微调、模型量化(GPTQ、AWQ)经验者优先;
6、有GPU服务器管理、CUDA优化、模型性能调优、分布式推理等相关的实践经验者优先;
7、有责任心和职业道德,良好的逻辑思维能力和团队合作精神。
职位福利
六险一金、员工食堂、带薪年假、工会福利、定期体检、周末双休、年度奖金

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请