1.5-3万
天津市河西区环湖南道9号6门
1.需求分析与数据准备:
ü 深入学习理解催收业务流程与还款预测的核心业务需求。
ü 负责催收相关数据的收集、清洗、整合与特征工程工作,为模型构建奠定坚实基础。
ü 分析数据分布与质量,识别并处理缺失值、异常值等问题,构建适用于小模型训练的高质量数据集。
ü 进行探索性数据分析,挖掘影响用户还款行为的潜在关键因子。
2.小模型选型与架构设计:
ü 根据业务场景、数据规模及部署环境(如对延迟、资源消耗有要求)的需求,评估并选择适合的轻量级机器学习模型或小型深度学习模型(例如:逻辑回归、决策树、随机森林、梯度提升树/XGBoost/LightGBM/CatBoost、小型神经网络、贝叶斯网络等)。
ü 设计高效、简洁且可解释性强的模型架构,优先考虑模型的计算效率和部署可行性。
3.模型开发与训练:
ü 构建、训练和优化用于预测用户还款概率/风险等级的轻量级基础模型。
ü 熟练运用特征选择/降维技术(如基于模型的重要性、相关性分析、PCA等),在保证模型效果的同时,严格控制模型复杂度(特征数量、参数规模),以满足“小模型”的核心要求。
ü 实施严格的模型训练流程,包括数据集划分(训练/验证/测试)、交叉验证等。
ü 应用超参数调优技术(如网格搜索、随机搜索、贝叶斯优化等),寻找小模型的配置。
4.模型评估与迭代:
ü 设计并实施针对催收还款预测任务的评估指标体系(如准确率、精确率、召回率、F1分数、AUC、KS值、业务指标转化率等)。
ü 重点评估模型在资源受限(小模型)条件下的性能表现和稳定性。
ü 分析模型预测结果,诊断模型偏差和潜在问题。
ü 根据评估结果和业务反馈,持续迭代优化模型特征、算法和参数。
5.模型部署支持与监控:
ü 与工程团队紧密协作,提供模型上线所需的技术支持(如模型文件导出、API接口规范说明)。
ü 协助将训练好的轻量级模型集成到生产环境中,并验证其运行效率。
ü 参与设计并实现模型性能监控方案,跟踪模型在生产环境中的预测效果和稳定性,及时触发模型再训练或更新。
6.文档编写与知识沉淀:
ü 清晰记录模型的设计思路、实验过程、参数配置、评估结果及部署细节。
ü 撰写技术文档和模型报告,向业务和技术团队有效传达模型价值和局限性。
总结小模型在催收预测场景中的应用经验。
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕