职位详情
nlp算法工程师
1.5-2万
成都天藤科技有限公司
成都
1-3年
硕士
03-25
工作地址

四川省成都市青羊区清江中路1号

职位描述
一、核心岗位职责

大语言模型本地化部署与优化

负责DeepSeek-R等大模型的本地化部署,设计GPU资源分配策略与推理加速方案;

开发模型压缩技术(如量化、剪枝)及显存优化方案,降低硬件资源消耗;

实现模型服务API封装,支持高并发低延迟的知识检索与生成场景。

知识库数据建模与算法开发

构建知识抽取算法:基于NLP技术实现非结构化文本的实体关系抽取、知识三元组生成及知识图谱构建;

设计知识表示与存储方案:结合图数据库(如Neo4j)与向量数据库(如Milvus)优化多模态知识存储结构;

开发知识增强算法:通过RAG(检索增强生成)技术提升大模型在垂直领域的准确性。

数据工程与模型训练

主导自有数据清洗与增强:设计数据标注规则、异常检测算法及数据增强策略(如对抗训练);

开发持续学习机制:结合主动学习(Active Learning)优化模型迭代效率,减少人工标注成本;

构建自动化训练流水线:集成PyTorch/TensorFlow框架实现分布式训练与超参数调优。

系统性能调优与监控

设计模型性能评估指标:包括响应延迟、知识召回率、生成内容合规性等;

实现算法模块的代码级优化:通过CUDA加速、多线程编程提升计算效率;

开发监控告警系统:实时跟踪模型推理异常(如幻觉生成、知识冲突)并触发自修复机制。


二、任职资格要求

技术能力

学历与专业:计算机科学、人工智能、数学相关专业硕士及以上学历,博士优先;

编程能力:精通Python/C++,熟悉PyTorch/TensorFlow框架,具备CUDA开发经验;

算法经验:

熟悉大模型微调技术(如LoRA、P-Tuning)及本地化部署方案;

掌握NLP核心技术(如BERT预训练、文本摘要、实体链接);

具备知识图谱构建经验(如Neo4j、DGL)。

项目经验

主导过知识库系统、问答系统或企业级搜索项目开发;

有处理TB级结构化/非结构化数据的实战经验;

熟悉RAG、向量检索等增强生成技术者优先。

软性素质

具备跨团队协作能力,能与产品经理、数据工程师协同定义技术方案;

对技术趋势敏感,持续跟踪LangChain、LlamaIndex等开源工具生态。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请