金融行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211027872.8 (22)申请日 2022.08.25 (71)申请人 中国工商银行股份有限公司 地址 100140 北京市西城区复兴门内大街 55号 (72)发明人 吕美洁 郭继泱 高小明 张天  (74)专利代理 机构 北京同立钧成知识产权代理 有限公司 1 1205 专利代理师 王征 黄健 (51)Int.Cl. G06N 3/04(2006.01) G06N 3/08(2006.01) G06Q 40/02(2012.01) (54)发明名称 风险评估 模型训练方法、 装置和服 务器 (57)摘要 本申请提供一种风险评估模 型训练方法、 装 置和服务器, 涉及人工智能领域。 该方法包括: 服 务器采集用户的历史贷款信息和用户信息。 服务 器根据用户信息和历史贷款信息生成真实样本 集合。 其中, 样本数据根据用户信息整理得到, 样 本标签根据历史贷款信息生 成。 服务器 建立对抗 生成网络模 型。 服务器利用真实样 本集合训练该 对抗生成网络模型的生成器和判别器。 服务器利 用训练好的生成器生成大量的仿真样本, 得到仿 真样本集合。 服务器使用真实样 本集合和仿真样 本集合生 成训练样本集合。 服务器将该训练样本 集合输入到风险评估模型中进行训练, 得到最终 的风险评估模型。 本申请 的方法, 提高了模型训 练的稳定性和模型分别的准确性。 权利要求书2页 说明书15页 附图3页 CN 115293336 A 2022.11.04 CN 115293336 A 1.一种风险评估 模型训练方法, 其特 征在于, 所述方法包括: 采集用户的用户信 息和历史贷款信 息, 并根据所述用户的所述用户信 息生成真实样本 集合, 根据所述用户的所述历史贷款信息生成样本标签, 所述样本标签包括按期还款和还 款违约两类; 利用对抗生成网络模型, 根据所述真实样本集合生成仿真样本集合, 每一所述仿真样 本中包括 一模拟用户的历史贷款信息和标签信息; 使用所述真实样本集合和所述仿真样本集合构建的训练样本集合对风险评估模型中 进行训练, 训练后的所述风险评估模型用于根据待评估用户的历史贷款信息进行风险预 测。 2.根据权利要求1所述的方法, 其特征在于, 所述利用对抗生成网络模型, 根据所述真 实样本集 合生成仿真样本集 合, 具体包括: 构建对抗 生成网络模型, 所述对抗 生成网络模型中包括 生成器和判别器; 将随机噪声输入到所述生成器生成仿真样本; 将所述仿真样本和所述判别器进行判 别; 根据所述真实样本和所述仿真样本的判别结果更新所述生成器中的模型参数, 以使所 述抗生成网络模型目标函数最小化; 根据所述真实样本和所述仿真样本的判别结果更新所述判别器中的模型参数, 以使所 述抗生成网络模型的目标函数最大化; 迭代上述步骤, 并对所述生成器和所述判别器进行交替训练, 直至所述对抗生成网络 模型的所述目标函数达 到纳什均衡; 使用完成迭代后的所述 抗生成网络模型中的所述 生成器, 生成仿真样本集 合。 3.根据权利要求1所述的方法, 其特征在于, 所述使用所述真实样本集合和所述仿真样 本集合构建的训练样本集 合对风险评估 模型中进行训练, 具体包括: 对所述真实样本和所述仿真样本中的所述历史贷款信息进行 预处理, 得到特 征向量; 使用预设的混合特征选择模型, 从所述真实样本集合和所述仿真样本集合组成的特征 向量集合中, 选择部分特 征向量组成训练样本集 合和测试样本集 合; 使用所述训练样本集合和所述测试样本集合, 对所述风险评估模型进行训练, 所述风 险评估模型为分类模型。 4.根据权利要求1所述的方法, 其特征在于, 所述根据所述用户的所述用户信 息生成真 实样本集 合, 根据所述用户的所述历史贷款信息生成样本标签, 具体包括: 根据每一所述用户的所述用户信息生成真实样本集 合中的一个真实样本; 根据每一所述用户的所述历史贷款信息, 确定每一所述用户是否存在还款违约情况; 当所述用户存在还款违约情况时, 确定所述真实样本的样本标签为还款违约; 否则, 确 定所述真实样本的样本标签为按期还款。 5.根据权利要求1 ‑4中任一项所述的方法, 其特 征在于, 所述方法, 还 包括: 从真实样本集 合中获取 预数量的真实样本, 组成模型测试集 合; 将所述模型测试集合中的所述真实样本输入训练后的所述风险评估模型, 得到每一所 述真实样本的预测结果; 根据每一所述真实样本的所述预测结果和样本标签, 确定所述风险评估模型的F1评价权 利 要 求 书 1/2 页 2 CN 115293336 A 2指标和AUC 评价指标; 根据所述F1评价指标和所述AUC 评价指标, 确定所述 风险评估 模型的评价结果。 6.根据权利要求1 ‑4中任一项所述的方法, 其特 征在于, 所述方法, 还 包括: 获取待评估用户的用户信息; 将所述待评估用户的所述用户信 息输入到训练后的所述风险评估模型, 得到所述待评 估用户的风险类别; 根据所述 风险类别, 确定所述待评估用户的贷款结果。 7.一种风险评估 模型训练装置, 其特 征在于, 所述装置, 包括: 采集模块, 用于采集用户的历史贷款信息, 并根据所述用户的所述历史贷款信息生成 真实样本集合, 每一所述真实样本中包括一用户的所述历史贷款信息和样本标签, 所述样 本标签包括按期还款和还款违约两类; 训练模块, 用于利用对抗生成网络模型, 根据 所述真实样本集合生成仿真样本集合, 每 一所述仿真样本中包括一模拟用户的历史贷款信息和标签信息; 使用所述真实样本集合和 所述仿真样本集合构建的训练样本集合对风险评估模型中进 行训练, 训练后的所述风险评 估模型用于根据待评估用户的历史贷款信息进行风险预测。 8.一种服 务器, 其特 征在于, 所述 服务器, 包括: 存 储器, 处理器; 所述存储器用于存储计算机程序; 所述处理器用于根据所述存储器存储的计算机程 序, 实现如权利要求1 ‑6中任意一项所述的风险评估 模型训练方法。 9.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质中存储有计算机 程序, 所述计算机程序被处理器执行时用于实现如权利要求1 ‑6中任意一项所述的风险评 估模型训练方法。 10.一种计算机程序产品, 其特征在于, 所述计算机程序产品包括计算机程序, 所述计 算机程序被处 理器执行时实现如权利要求1 ‑6中任意一项所述的风险评估 模型训练方法。权 利 要 求 书 2/2 页 3 CN 115293336 A 3

PDF文档 专利 风险评估模型训练方法、装置和服务器

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 风险评估模型训练方法、装置和服务器 第 1 页 专利 风险评估模型训练方法、装置和服务器 第 2 页 专利 风险评估模型训练方法、装置和服务器 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:15:44上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。