2.5-4万·14薪
成都市-金牛区-信息园西路83号兴盛国际商务总部
负责DeepSeek-R等大模型的本地化部署,实现高效GPU资源分配及推理加速方案。
开发模型压缩技术(量化、剪枝等)及显存优化方案,降低硬件资源消耗。
封装模型服务API,支持高并发、低延迟的知识检索与生成场景。
构建知识抽取算法:基于NLP技术实现非结构化文本的实体关系抽取、知识三元组生成及知识图谱构建。
设计知识表示与存储方案:结合图数据库(Neo4j)与向量数据库(Milvus)优化多模态知识存储结构。
开发知识增强算法:利用RAG(检索增强生成)技术提升大模型在垂直领域的准确性和可解释性。
主导自有数据清洗与增强:设计数据标注规则、异常检测算法及数据增强策略(如对抗训练)。
开发持续学习机制:结合主动学习(Active Learning)优化模型迭代效率,降低人工标注成本。
构建自动化训练流水线:集成PyTorch/TensorFlow框架,实现分布式训练与超参数调优。
设计模型性能评估指标:包括响应延迟、知识召回率、生成内容合规性等。
进行算法模块的代码级优化:通过CUDA加速、多线程编程提升计算效率。
开发监控告警系统:实时跟踪模型推理异常(如幻觉生成、知识冲突),并实现自修复机制。
学历与专业:计算机科学、人工智能、数学相关专业硕士及以上学历,博士优先。
编程能力:精通Python/C++,熟悉PyTorch/TensorFlow框架,具备CUDA开发经验。
算法经验:
熟悉大模型微调技术(LoRA、P-Tuning)及本地化部署方案。
掌握NLP核心技术(BERT预训练、文本摘要、实体链接等)。
具备知识图谱构建经验(Neo4j、DGL等)。
主导过知识库系统、问答系统或企业级搜索项目开发。
有处理TB级结构化/非结构化数据的实战经验。
熟悉RAG、向量检索等增强生成技术者优先。
具备跨团队协作能力,能与产品经理、数据工程师协同定义技术方案。
对AI技术趋势敏感,持续跟踪LangChain、LlamaIndex等开源工具生态。
有大型AI产品或项目落地经验。
熟悉云计算平台(AWS/GCP/Azure)和模型部署(Docker/Kubernetes)。
了解生成式AI(如ChatGPT、Diffusion)、大语言模型(LLM)应用开发。
具有开源项目贡献经验或技术博客。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕