职位描述
工作职责:
负责大规模预训练模型的行业化微调与检索增强生成解决方案落地。
● 核心职责:
○ 垂直领域大模型微调:根据行业语料(操作手册、安全规程、维修记录等)进行定制化训练;
○ 设计并实现 RAG(Retrieval-Augmented Generation)框架,搭建高效向量检索系统(FAISS、Milvus);
○ 管理 Embedding 流水线:向量更新、索引重构、降维与压缩;
○ 协助企业构建专属行业大模型平台,提供接口设计、推理服务与成本优化方案;
○ 持续优化生成质量,通过 Prompt Engineering 与检索增强提升准确性。
● 日常工作:
○ 评估并选型开源大模型,搭建微调与推理环境;
○ 与 NLP 与知识工程团队协同,清洗与标注行业语料;
○ 监控服务性能与资源消耗,定期优化检索策略;
○ 编写使用文档与落地方案,组织内部培训。
任职资格:
○ 硕士及以上学历,计算机、人工智能、自然语言处理相关专业;硕士及以上优先;
○ 1 年及以上大模型微调或 RAG 框架落地经验;
○ 熟练掌握 PyTorch、Transformers、FAISS/Milvus 等工具;
○ 有行业大模型平台搭建或经验者优先;
○ 具备领域论文发表者优先(方向顶会/顶刊优先)。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕