职位详情
风控策略机器学习工程师
2-3万
天津中建北方集团有限公司
天津
1-3年
本科
07-18
工作地址

天津市河西区环湖南道9号6门

职位描述

1.需求分析与数据准备:

ü 深入学习理解催收业务流程与还款预测的核心业务需求。

ü 负责催收相关数据的收集、清洗、整合与特征工程工作,为模型构建奠定坚实基础。

ü 分析数据分布与质量,识别并处理缺失值、异常值等问题,构建适用于小模型训练的高质量数据集。

ü 进行探索性数据分析,挖掘影响用户还款行为的潜在关键因子。

2.小模型选型与架构设计:

ü 根据业务场景、数据规模及部署环境(如对延迟、资源消耗有要求)的需求,评估并选择适合的轻量级机器学习模型或小型深度学习模型(例如:逻辑回归、决策树、随机森林、梯度提升树/XGBoost/LightGBM/CatBoost、小型神经网络、贝叶斯网络等)。

ü 设计高效、简洁且可解释性强的模型架构,优先考虑模型的计算效率和部署可行性。

3.模型开发与训练:

ü 构建、训练和优化用于预测用户还款概率/风险等级的轻量级基础模型。

ü 熟练运用特征选择/降维技术(如基于模型的重要性、相关性分析、PCA等),在保证模型效果的同时,严格控制模型复杂度(特征数量、参数规模),以满足“小模型”的核心要求。

ü 实施严格的模型训练流程,包括数据集划分(训练/验证/测试)、交叉验证等。

ü 应用超参数调优技术(如网格搜索、随机搜索、贝叶斯优化等),寻找小模型的配置。

4.模型评估与迭代:

ü 设计并实施针对催收还款预测任务的评估指标体系(如准确率、精确率、召回率、F1分数、AUC、KS值、业务指标转化率等)。

ü 重点评估模型在资源受限(小模型)条件下的性能表现和稳定性。

ü 分析模型预测结果,诊断模型偏差和潜在问题。

ü 根据评估结果和业务反馈,持续迭代优化模型特征、算法和参数。

5.模型部署支持与监控:

ü 与工程团队紧密协作,提供模型上线所需的技术支持(如模型文件导出、API接口规范说明)。

ü 协助将训练好的轻量级模型集成到生产环境中,并验证其运行效率。

ü 参与设计并实现模型性能监控方案,跟踪模型在生产环境中的预测效果和稳定性,及时触发模型再训练或更新。

6.文档编写与知识沉淀:

ü 清晰记录模型的设计思路、实验过程、参数配置、评估结果及部署细节。

ü 撰写技术文档和模型报告,向业务和技术团队有效传达模型价值和局限性。

总结小模型在催收预测场景中的应用经验。

以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

立即申请