岗位职责
参与基于开源⼤语⾔模型(如 Qwen、DeepSeek等)⾯向真实业务场景的 AI 应⽤系统开发,包括但不限
于知识问答、内容⽣成、数据分析等具体功能模块;
承担 RAG(检索增强⽣成)系统的端到端开发与持续优化,涵盖知识库构建、⾮结构化⽂档解析
(PDF/Word等)、⽂本分块策略、向量索引、混合检索(BM25 + 向量)、重排序(Rerank)及⽣成质量
提升;
参与 Agent 架构相关功能开发,包括⼯具调⽤(Function Calling)、任务分解、记忆管理或多智能体协作
中的具体组件实现;
协同其他团队,将⼤模型能⼒集成到企业内部系统(如 CRM、ERP、知识库、数据库)中,完成指定功能
模块的对接与联调;
通过 Prompt Engineering、模型微调(LoRA/QLoRA)或评估优化(如 RAGAS),提升所负责模块的
准确性与稳定性;
参与模型服务封装(FastAPI/Flask)、容器化部署(Docker)及性能监控,保障所开发模块的可⽤性与响
应效率;
编写清晰的技术⽂档,沉淀⼯程规范与最佳实践,推动团队 AI 应⽤开发能⼒标准化。
任职要求
学历:计算机、软件⼯程、⼈⼯智能或相关专业 本科及以上学历,须提供毕业院校信息;
经验:2~5年 软件开发或AI相关⼯作经验,⾄少1年⼤模型应⽤开发经验,有参与完整项⽬上线的经历;
技术能⼒(满⾜以下多数项,在 RAG 系统优化或 Agent 开发⽅⾯有深⼊实践者优先):
熟练掌握 Python 作为主要开发语⾔,具备良好的⼯程规范与代码可维护性;
熟悉 LangChain / LlamaIndex 框架,有 RAG、Agent 或 Function Calling 相关模块的开发经
验;
了解主流开源⼤模型(Qwen、DeepSeek、ChatGLM 等)的基本使⽤与微调⽅法(如 LoRA);
掌握 向量数据库(如 Milvus、Chroma)或传统数据库(MySQL、Redis、Elasticsearch)的使
⽤;
熟悉 Embedding 模型(如 BGE、text2vec)及检索优化策略(混合检索、rerank、query 改写
等);
具备 Web 接⼝开发能⼒(FastAPI / Flask),了解 Docker 基础⽤法;
软技能要求:
具备良好的沟通能⼒与团队协作意识,能清晰表达技术⽅案并接受反馈;
乐于在团队中承担具体任务,对交付质量有责任⼼;
加分项:有 LangGraph、Agno等多智能体框架使⽤经验;
熟悉 vLLM、SGLang 等推理部署⼯具;
有 GitHub 开源项⽬或技术博客。
我们期待这样的你
不夸⼤个⼈作⽤,但对所负责的模块精益求精;
能在团队中找准定位,⾼效协同,共同交付价值;
关注技术落地,⽽⾮仅停留在 Demo 或理论层⾯。
我们看重
能否把⼤模型真正⽤起来,解决业务痛点;
能否写出可维护、可扩展、⾼可⽤的 AI 应⽤代码;
是否具备从需求分析到上线运维的端到端交付能⼒。