职位详情
大模型微调与蒸馏优化工程师(催收场景应用)
2-3万
天津中建北方集团有限公司
天津
1-3年
本科
07-18
工作地址

天津市河西区环湖南道9号6门

职位描述

岗位核心目标:

负责设计、开发与优化基于大语言模型(LLM)的轻量化智能催收解决方案。通过先进的模型微调(Fine-tuning)和知识蒸馏(KnowledgeDistillation)技术,显著缩小模型参数量,降低推理所需的算力成本,并大幅减少服务响应时延,以满足催收业务对高效、实时、低成本AI能力的需求。

主要岗位职责:

1.模型压缩策略设计与实施:

ü 深入理解催收业务场景(如智能外呼对话、还款意愿/能力预测、话术建议、风险评估等)对模型性能和效率的具体要求。

ü 设计并主导实施基于“大模型微调”和“知识蒸馏”的模型压缩技术路线图,以生成高性能、低参数量的轻量级模型。

ü 探索和应用先进的微调技术(如LoRA,Adapter,Prefix-Tuning等参数高效微调方法)以适应催收领域数据,提升模型任务表现。

ü 设计并执行有效的蒸馏方案,选择合适的教师模型(TeacherModel)和架构精简的学生模型(StudentModel),将大模型的知识高效迁移到小模型中。

2.催收场景数据集构建与处理:

ü 与业务团队紧密合作,理解催收流程、沟通话术、客户画像及合规要求。

ü 主导或参与构建、清洗、标注适用于催收任务的特定领域高质量数据集(如催收对话文本、客户历史行为数据、催收结果记录等)。

ü 设计数据增强策略,提升模型在催收场景下的鲁棒性和泛化能力。

3.轻量化模型开发与训练:

ü 选择合适的预训练大模型(如开源LLM)作为基础。

ü 开发高效的微调和蒸馏训练脚本与流程。

ü 训练、调优和评估经过压缩后的轻量级学生模型,确保其在催收核心任务(如意图识别、情绪分析、关键信息抽取、风险评分、对话生成等)上的性能达到业务要求,同时显著降低模型大小和复杂度。

4.模型性能评估与优化:

ü 建立全面的评估指标体系,不仅关注模型在催收任务上的准确率、召回率等业务指标,尤其关注模型压缩后的关键性能指标:

n 模型参数量&体积:量化压缩效果。

n 推理速度/时延:在目标硬件(CPU/边缘设备/云服务器)上测量端到端响应时间,确保满足催收实时交互需求。

n 计算资源消耗(FLOPs,内存占用):精确评估模型运行所需的算力资源。

n 能效比:评估单位算力或单位时间内的任务处理能力。

ü 持续迭代优化模型架构、蒸馏策略和训练方法,在模型性能、大小、时延和资源消耗之间寻求平衡点。

5.模型部署与推理优化:

ü 与工程团队协作,将优化后的轻量级模型高效部署到生产环境。

ü 应用模型量化(Quantization)、剪枝(Pruning)、硬件加速(如TensorRT,ONNXRuntime优化)等技术,进一步降低推理时延和资源消耗。

ü 监控线上模型的性能和效率指标,持续进行优化。

6.算力成本分析与优化:

ü 评估不同模型方案(原始大模型vs压缩后模型)在训练和推理阶段的算力成本差异。

ü 提供数据支持,证明通过模型压缩技术实现的算力节省和成本降低。

7.技术研究与创新:

ü 跟踪大模型压缩、高效微调、知识蒸馏等领域的技术进展(如结构化蒸馏、任务自适应蒸馏、动态蒸馏等)。

ü 探索并尝试将前沿技术应用于催收场景,持续提升轻量化模型的能力边界和效率。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请