岗位职责:
1、算法研发与优化:参与大语言模型(LLM)的微调与适配,针对业务场景(如智能客服、文本生成)优化模型性能;设计并实现基于Transformer的文本分类、实体识别、情感分析等NLP任务解决方案;探索RAG(检索增强生成)、Agent(智能体)等前沿技术,提升模型在复杂场景中的表现。
2、数据处理与特征工程:负责多源文本数据的清洗、标注与预处理,构建高质量训练数据集;设计文本特征提取方法(如词向量、句向量、主题模型),提升模型输入质量。
3、模型部署与性能调优:将训练好的模型工程化落地,通过量化、剪枝等技术优化推理速度;
监控模型线上效果,分析数据分布变化,迭代优化模型参数。
4、跨团队协作:与产品、开发团队紧密合作,将算法能力转化为实际业务功能;
输出技术文档,包括算法设计思路、实验报告及性能评估结果。
任职资格:
1、技术能力:熟练掌握Python编程,熟悉PyTorch/TensorFlow框架;
理解NLP基础任务(如词性标注、句法分析、语义理解)及常用模型(如BERT、GPT、T5);
有文本分类、命名实体识别、机器翻译等实际项目经验者优先。
2、工具与资源:熟悉Hugging Face、LangChain等NLP工具链;
有使用GPU集群(如A100/H100)进行大规模模型训练的经验者加分。
3、熟悉强化学习、多模态学习等前沿领域优先;