1.5-3万·14薪
阿里中心·滨江4号楼111
岗位职责:
1、LLM应用开发与优化
负责大语言模型(LLM)相关应用的开发、优化和部署,包括但不限于问答系统、智能对话、内容生成等场景。
设计和实现基于LLM的复杂应用流程,如检索增强生成(RAG)、多轮对话系统、任务自动化(Agent)等。
优化LLM应用的性能,包括响应速度、准确性和用户体验。
2、技术栈集成与工具使用
熟练使用LangChain、LangGraph等LLM应用框架,构建高效、可扩展的应用流程。
集成向量数据库实现高效的文本检索和相似性搜索。快速搭建和部署LLM应用。
数据处理与模型集成 ,负责数据的收集、清洗和预处理,构建高质量的训练和测试数据集。
实现文本嵌入(Embedding)模型的集成与应用,提升文本表示的质量。
结合外部知识库或API,增强LLM的能力,实现更精准的问答和推理。
3、Prompt设计与模型调优
设计高效的提示词(Prompt),提升LLM的输出质量和稳定性。
对LLM的输出进行评估和优化,解决模型生成中的偏见、错误或不一致问题。
4、团队协作
与产品经理、技术总监等团队成员紧密合作,理解业务需求并转化为技术方案。
参与项目的全生命周期管理,包括需求分析、技术设计、开发实现、测试部署和运维支持。
编写清晰的技术文档,分享技术经验和实践,提升团队整体技术水平。
技能要求:
1、精通Python编程,具备扎实的算法和数据结构基础。
熟悉常用深度学习框架,如PyTorch,能够独立完成模型训练、调优和部署。
了解Transformer架构及其在自然语言处理(NLP)中的应用。
2、深入了解大语言模型(LLM)的应用框架,包括但不限于LangChain、LangGraph、LlamaIndex等
掌握LLM相关技术栈,如:
Embedding技术:熟悉文本嵌入模型,能够实现文本向量化表示。
向量数据库(Vector DB):熟练使用Pinecone、Weaviate、Milvus、FAISS等向量数据库,实现高效的相似性搜索和数据存储。
检索增强生成(RAG):具备RAG架构的实际应用经验,能够结合LLM与外部知识库实现高质量的问答系统。
Agent技术:熟悉LLM驱动的Agent开发,能够设计并实现多轮对话、任务规划和自动化工作流。
了解LLM的微调(Fine-tuning)技术,包括LoRA、QLoRA等高效微调方法。
3、熟练掌握LangChain和LangGraph,有实际项目经验,能够构建复杂的LLM应用流程。熟悉Dify、Coze等LLM应用开发平台,能够快速搭建和部署LLM应用。熟悉基于docker的部署,具备LLM应用的全流程开发经验,包括需求分析、数据处理、模型集成、性能优化和部署上线。
4、熟悉Prompt Engineering,能够设计高效的提示词(Prompt)以提升LLM的输出质量。了解LLM的评估方法,能够设计并实施对模型性能的评估和测试。
5、具备良好的沟通能力和团队协作精神,能够与产品、设计、工程等多部门高效合作。具备较强的学习能力和问题解决能力,能够快速掌握新技术并应用于实际项目。对AI技术有热情,关注行业前沿动态,能够主动提出创新性解决方案。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕