岗位职责:
1. 端到端负责大模型训练:设计并执行预训练、微调和强化学习方案,优化训练策略、数据调度与超参数;搭建与维护分布式训练平台,提升效率与资源利用率。
2. 构建与优化AI原生知识体系:应用检索增强(RAG)技术,搭建AI知识库;主导知识图谱开发,包括实体/关系抽取、图谱存储与质量迭代,实现多源异构知识融合。
3. 复杂智能体(Agent)开发:实现多智能体通信与协作,推进智能体间高效交互。
4. 后端服务与部署:基于 FastAPI/Flask/Django 开发接口,使用 Docker 容器化交付;掌握大模型本地化部署流程。
5. 工具与框架:熟练应用 LangChain、RAGFlow、AutoGen 等生态,借助 AI 编程工具加速需求分析、设计与测试。
任职要求:
1. 本科及以上学历,计算机、软件工程、人工智能等相关专业。
2. 年及以上 Python 开发经验,精通数据结构与算法;理解 LLM 原理,具备 RAG/Agent 项目实战经验。
3. 熟悉 PyTorch Lightning、DeepSpeed、Accelerate 等训练框架及分布式训练技术。
4. 精通至少一种 模型通信框架(Flask/ FastAPI/ Django)与 Docker 容器化。
5. 有知识图谱构建经验,熟悉 Neo4j、JanusGraph 等图数据库及知识抽取与融合方法。
良好沟通协作能力,学习快速,能适应高节奏研发环境。