职位描述
一、核心岗位职责
大语言模型本地化部署与优化
负责DeepSeek-R等大模型的本地化部署,设计GPU资源分配策略与推理加速方案;
开发模型压缩技术(如量化、剪枝)及显存优化方案,降低硬件资源消耗;
实现模型服务API封装,支持高并发低延迟的知识检索与生成场景。
知识库数据建模与算法开发
构建知识抽取算法:基于NLP技术实现非结构化文本的实体关系抽取、知识三元组生成及知识图谱构建;
设计知识表示与存储方案:结合图数据库(如Neo4j)与向量数据库(如Milvus)优化多模态知识存储结构;
开发知识增强算法:通过RAG(检索增强生成)技术提升大模型在垂直领域的准确性。
数据工程与模型训练
主导自有数据清洗与增强:设计数据标注规则、异常检测算法及数据增强策略(如对抗训练);
开发持续学习机制:结合主动学习(Active Learning)优化模型迭代效率,减少人工标注成本;
构建自动化训练流水线:集成PyTorch/TensorFlow框架实现分布式训练与超参数调优。
系统性能调优与监控
设计模型性能评估指标:包括响应延迟、知识召回率、生成内容合规性等;
实现算法模块的代码级优化:通过CUDA加速、多线程编程提升计算效率;
开发监控告警系统:实时跟踪模型推理异常(如幻觉生成、知识冲突)并触发自修复机制。
二、任职资格要求
技术能力
学历与专业:计算机科学、人工智能、数学相关专业硕士及以上学历,博士优先;
编程能力:精通Python/C++,熟悉PyTorch/TensorFlow框架,具备CUDA开发经验;
算法经验:
熟悉大模型微调技术(如LoRA、P-Tuning)及本地化部署方案;
掌握NLP核心技术(如BERT预训练、文本摘要、实体链接);
具备知识图谱构建经验(如Neo4j、DGL)。
项目经验
主导过知识库系统、问答系统或企业级搜索项目开发;
有处理TB级结构化/非结构化数据的实战经验;
熟悉RAG、向量检索等增强生成技术者优先。
软性素质
具备跨团队协作能力,能与产品经理、数据工程师协同定义技术方案;
对技术趋势敏感,持续跟踪LangChain、LlamaIndex等开源工具生态。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕