金融行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211077614.0 (22)申请日 2022.09.05 (71)申请人 中国银行股份有限公司 地址 100818 北京市西城区复兴门内大街1 号 (72)发明人 张绍志  (74)专利代理 机构 北京集佳知识产权代理有限 公司 11227 专利代理师 赵春华 (51)Int.Cl. G06Q 40/02(2012.01) G06Q 10/04(2012.01) G06K 9/62(2022.01) G06N 5/00(2006.01) (54)发明名称 贷款违约风险预测模 型的获得方法、 使用方 法及装置 (57)摘要 本公开提供的贷款违约风险预测模型的获 得方法、 使用方法及装置, 可应用于人工智 能领 域、 大数据领域或金融领域。 本公开通过不平衡 随机森林特征选择算法对所述客户贷款违约样 本数据进行特征选择, 实现贷款违约风险预测模 型的二分类过程, 利用该贷款违约风险预测模型 可以准确预测客户的贷款违约风险, 有助于金融 机构有效防范贷款违约风险, 降低不良资产率。 权利要求书2页 说明书7页 附图5页 CN 115330530 A 2022.11.11 CN 115330530 A 1.一种贷款违约风险预测模型的获得 方法, 其特 征在于, 包括: 获得客户贷款违约样本数据, 其中, 所述客户贷款违约样本数据包括客户的贷款信息 数据和客户特征信息数据, 所述贷款信息数据包括贷款违约数据, 所述客户特征信息数据 包括所述 客户的收入信息数据、 消费信息数据以及个人信息数据; 利用不平衡随机森林特征选择算法对所述客户贷款违约样本数据进行特征选择, 获得 第一数据集; 利用SMOTE算法对所述第一数据集进行 过采样处 理, 获得第二数据集; 利用所述第二数据集, 构建出贷款违约风险预测模型。 2.根据权利要求1所述的方法, 其特征在于, 所述利用不平衡随机森林特征选择算法对 所述客户贷款违约样本数据进行 特征选择, 获得第一数据集, 包括: 对所述客户贷款违约样本数据进行欠采样处 理, 获得多个欠采样数据集; 计算出所述欠采样数据集的特 征重要性度量 值和特征权重; 基于所述特征重要性度量值和所述特征权重进行加权计算, 获得与 所述客户贷款违约 样本对应的特 征重要性序列; 基于所述特征重要性序列对所述客户贷款违约样本数据进行特征选择, 获得第 一数据 集。 3.根据权利要求1所述的方法, 其特征在于, 所述利用所述第二数据集, 构建出贷款违 约风险预测模型, 包括: 利用所述第二数据集对预设Logistics回归算法模型进行训练, 获得目标Logistics回 归算法模型; 利用所述第二数据集对预设零截尾泊松模型进行训练, 获得目标零截尾泊松模型; 利用所述目标Logistics回归算法模型和所述预设零截尾泊松模型, 构建出贷款违约 风险预测模型。 4.根据权利 要求1所述的方法, 其特征在于, 所述贷款违约风险预测模型为Hurdle计数 模型。 5.一种贷款违约风险预测模型的使用方法, 其特 征在于, 包括: 获得客户的贷款信息数据和客户特 征信息数据; 将所述贷款信息数据和所述客户特征信息数据输入至权利要求1至4中任一所述贷款 违约风险预测模型的获得方法得到的所述贷款违约风险预测模型中, 获得所述贷款违约风 险预测模型输出的与所述 客户对应的贷款违约预测结果。 6.一种贷款违约风险预测模型的获得装置, 其特征在于, 包括: 样本数据获得单元、 第 一数据集获得 单元、 第二数据集获得 单元以及模型构建单 元, 所述样本数据获得单元, 用于获得客户贷款违约样本数据, 其中, 所述客户贷款违约样 本数据包括客户的贷款信息数据和客户特征信息数据, 所述贷款信息数据包括贷款违约数 据, 所述客户特征信息数据包括所述客户的收入信息数据、 消费信息数据以及个人信息数 据; 所述第一数据集获得单元, 用于利用不平衡随机森林特征选择算法对所述客户贷款违 约样本数据进行 特征选择, 获得第一数据集; 所述第二数据集获得单元, 用于利用SMOTE算法对所述第一数据集进行过采样处理, 获权 利 要 求 书 1/2 页 2 CN 115330530 A 2得第二数据集; 所述模型构建单 元, 用于利用所述第二数据, 构建出贷款违约风险预测模型。 7.根据权利要求6所述的装置, 其特征在于, 所述第一数据集获得单元包括: 第一获得 子单元、 第一计算子单 元、 第二获得子单 元以及第三获得子单 元, 所述第一获得子单元, 用于对所述客户贷款违约样本数据进行欠采样处理, 获得多个 欠采样数据集; 所述第一计算子单元, 用于计算出所述欠采样数据集的特征重要性度量值和特征权 重; 所述第二获得子单元, 用于基于所述特征重要性度量值和所述特征权重进行加权计 算, 获得与所述 客户贷款违约样本对应的特 征重要性序列; 所述第三获得子单元, 用于基于所述特征重要性序列对所述客户贷款违约样本数据进 行特征选择, 获得第一数据集。 8.根据权利要求6所述的装置, 其特征在于, 所述模型构建单元包括: 第一模型获得子 单元、 第二模型获得子单 元以及第三模型获得子单 元, 所述第一模型获得子单元, 用于利用所述第二数据集对预设Logistics回归算法模型 进行训练, 获得目标L ogistics回归算法模型; 所述第二模型获得子单元, 用于利用所述第二数据集对预设零截尾泊松模型进行训 练, 获得目标零截尾泊松模型; 所述第三模型获得子单元, 用于利用所述目标Logistics回归算法模型和所述预设零 截尾泊松模型, 构建出贷款违约风险预测模型。 9.根据权利 要求6所述的装置, 其特征在于, 所述贷款违约风险预测模型为Hurdle计数 模型。 10.一种贷款违约风险预测模型的使用装置, 其特征在于, 包括: 客户数据获得单元以 及贷款违约预测单 元, 所述客户数据获得 单元, 用于获得客户的贷款信息数据和客户特 征信息数据; 所述贷款违约预测单元, 用于将所述贷款信 息数据和所述客户特征信 息数据输入至权 利要求6至9中任一所述贷款违约风险预测模型 的获得装置得到的所述贷款违约风险预测 模型中, 获得 所述贷款违约风险预测模型输出的与所述 客户对应的贷款违约预测结果。权 利 要 求 书 2/2 页 3 CN 115330530 A 3

PDF文档 专利 贷款违约风险预测模型的获得方法、使用方法及装置

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 贷款违约风险预测模型的获得方法、使用方法及装置 第 1 页 专利 贷款违约风险预测模型的获得方法、使用方法及装置 第 2 页 专利 贷款违约风险预测模型的获得方法、使用方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:15:35上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。