岗位职责:
1.负责基础NLP技术的研发与优化,服务于RAG和产品检索等核心业务,包括但不限于文本分类、序列标注(NER/词性标注)、句法分析、语义理解等传统NLP任务,持续提升核心算法的准确率与泛化能力;
2.深入研发文本-图片表征学习技术,优化embedding算法,结合对比学习、知识增强等方法提升文本向量在语义匹配、检索排序等下游场景的表现,支持多语言、多模态的语义匹配需求;
3.构建领域定制化NLP解决方案,结合大模型进行知识迁移与蒸馏,研发轻量化模型部署方案,满足低资源场景下的实时推理需求;
4.与产品、数据及内部AI技术团队协作,针对具体业务问题,进行数据的分析与清洗,设计模型训练、优化和评测方案。通过数据分析与实验验证,不断迭代优化模型,解决实际应用中的挑战。
5.推动基础NLP技术在业务场景中的技术验证与落地应用,沉淀可复用的算法组件库,持续输出技术专利或高质量学术成果;
任职要求:
1.计算机/人工智能相关专业硕士及以上学历,5年以上NLP相关经验,有丰富文本分类、文本向量化、排序等实践经验;
2.精通Transformer架构及其变体,熟练掌握BERT、GPT等经典模型实现细节;
3.熟悉常见的embedding模型(如BGE、E5等向量化和排序模型);
4.熟练使用PyTorch框架,具备模型压缩及服务部署经验(TensorRT/ONNX等)。