岗位职责
1.算法架构设计:主导大模型及多智能体系统的整体技术方案与架构设计,制定训练策略、数据管道与部署流程;
2.训练与优化:深度参与预训练、微调与强化学习全流程,针对大规模分布式环境优化训练效率、资源调度与超参数搜索;
知识系统管理:统筹 AI 知识库与知识图谱建设,设计高可用存储与实时更新机制,推动异构数据源融合与质量监控;
3.平台与工具链:驱动或选型 PyTorch Lightning、DeepSpeed、Accelerate 等先进训练框架与自动化工具,完善 CI/CD、监控与故障恢复;
技术落地与评估:在关键业务场景中推动大模型落地,领导性能、安全与成本评估,提出持续迭代方案;
4.团队赋能:指导和培养算法团队成员,组织技术分享与 Code Review,推动研发效率与工程规范提升;
5.跨部门协作:与产品、数据、DevOps 等团队紧密配合,确保项目按期交付并满足质量标准;
任职要求
1.本科及以上学历,具备 5 年及以上 AI 算法或大数据研发经验,硕士及以上优先;
2.精通 Python,熟练掌握数据结构与算法,具备大规模分布式训练实战经验;
深入理解深度学习原理及主流模型(Transformer、GPT、BERT 系列等),具备 RAG、Agent、RLHF 等高级应用经验;
3.精通至少一种大模型训练框架(如 PyTorch Lightning、DeepSpeed、Accelerate)及 Kubernetes/Docker 编排;
丰富的知识图谱构建与管理经验,熟悉 Neo4j/JanusGraph 或 RDF 三元组存储与 SPARQL 查询;
4.熟练掌握 FastAPI/Flask/Django 等后端框架及微服务架构设计;
5.具备优秀的项目管理与跨团队沟通能力,能在复杂业务场景中驱动落地与创新;
有大模型本地化与云端混合部署经验者优先。