1.5-3万
中关村SOHO大厦A区9层901
工作职责:
一、大模型应用开发与优化
1、负责大模型(如GPT、LLaMA、ChatGLM等)在知识库构建、智能问答、代码生成等场景的应用开发,设计高效、可靠的系统架构。
2、优化大模型性能,解决推理延迟、资源占用高、长文本处理等技术难点,提升用户体验
3、结合业务需求,设计Prompt工程、模型微调(Fine-tuning)、RAG(检索增强生成)等方案
二、场景落地与工程化
1、主导或参与大模型在保险、医疗领域的场景落地,包括知识库问答系统、代码助手工具、多轮对话系统等。
2、实现大模型与业务数据的深度结合,构建数据清洗、向量化检索、结果后处理等全链路能力。
三、技术预研与创新
1、跟踪大模型领域的前沿技术(如Agent、多模态模型压缩等),探索其在业务中的应用可能性。
2、针对业务场景,开发定制化工具链或中间件,提升开发效率。
四、团队协作与交付
1、与算法团队、产品经理紧密合作,推动技术方案的高质量交付。
2、编写技术文档,输出最佳实践,推动团队技术能力提升。
岗位要求:
一、基础要求
1、计算机科学、人工智能、数学等相关专业本科及以上学历,1-3年应用软件开发经验。
2、扎实的编程能力,精通Python,熟悉C++/Java/Go等至少一门语言,熟悉Linux开发环境。
二、技术能力
1、熟悉主流深度学习框架(PyTorch/TensorFlow),具备大模型训练、微调、部署经验,
2、熟悉LangChain、Llamalndex等大模型应用开发框架,或类似工具的实际项目经验。
3、熟悉大模型相关技术栈,如向量数据库(MilvusFAISS)、分布式推理、模型量化等。
4、有检索增强(RAG)、模型压缩(LORA、QLORA)、Agent开发经验者优先。
三、项目经验
1、必须:主导或深度参与过至少1个大模型场景落地项目(如知识库问答、智能客服、代码生成工具等),有实际应用产品开发经验。
2、熟悉大模型应用全流程开发,包括数据处理、模型调优、服务部署、效果评估等环节。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕