金融行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211051926.4 (22)申请日 2022.08.31 (71)申请人 重庆大学 地址 400038 重庆市沙坪坝区正 街174号 (72)发明人 陈逢章  (74)专利代理 机构 重庆智慧之源知识产权代理 事务所(普通 合伙) 50234 专利代理师 余洪 (51)Int.Cl. G06Q 40/02(2012.01) G06F 16/215(2019.01) G06F 16/2457(2019.01) G06K 9/62(2022.01) (54)发明名称 一种基于大数据的用户信息评估及风控方 法、 装置及设备 (57)摘要 本发明提供一种基于大数据的用户信息评 估及风控 方法、 装置及设备, 其中, 方法通过将获 取到的历史用户的基本信息进行去标识化处理, 得到初始数据; 并将初始数据上传至云端, 进行 数据清洗处理, 从而得到目标数据; 再根据预设 的模型对目标数据进行特征选择, 进一步得到目 标特征; 然后根据目标特征建立风控模型, 并用 历史用户的基本信息对风控模型进行训练, 得到 目标风控模 型; 最终根据目标风控模 型对待审核 用户进行风控评估, 实现对用户的定量风控评 估, 提高了贷前风控评估的效率和准确性。 权利要求书2页 说明书6页 附图2页 CN 115393056 A 2022.11.25 CN 115393056 A 1.一种基于大 数据的用户信息 评估及风控方法, 其特 征在于, 包括: 获取历史用户的基本信息, 所述基本信息分为用户信息和贷款信息; 对所述基本信息进行去标识化处 理, 得到初始数据; 将所述初始数据上传并存 储至云端; 在云端对所述初始数据进行 数据清洗处 理, 得到目标 数据; 根据预设的模型对所述目标 数据进行 特征选择, 得到目标 特征; 根据所述目标特征建立风控模型, 并根据 所述历史用户的基本信 息对所述风控模型进 行训练, 得到目标风控 模型; 获取待审核用户的初始信 息, 并根据 所述目标风控模型对所述待审核用户进行风控评 估。 2.如权利要求1所述的方法, 其特征在于, 所述基本信息分为用户信息和贷款信息, 具 体为: 所述用户信息至少包括用户姓名、 用户性别、 个人征信、 婚姻状况、 配偶征信、 工作情 况、 个人守约行为; 所述贷款信息 至少包括贷款次数、 还款情况、 贷款金额、 贷款时间。 3.如权利要求2所述的方法, 其特征在于, 对所述基本信息进行去标识化处理, 得到初 始数据, 具体为: 通过数据转换将所述基本信 息转换为多个类型的字节, 并根据每个所述历史用户的基 本信息创建对应的数据集; 对所述数据集中可识别个人信息的字节进行 标记, 得到标记字节; 根据所述标记字节的类型, 分别进行去除和抽象化处 理, 得到目标字节; 所述目标字节组成数据集, 根据所述数据集得到初始数据。 4.如权利要求3所述的方法, 其特征在于, 所述在云端对所述初始数据进行数据清洗处 理, 得到目标 数据, 具体为: 对存储在云端的所述初始数据进行缺失值过 滤; 并对所述初始数据进行 经验性数据过 滤, 得到目标 数据。 5.如权利要求1所述的方法, 其特征在于, 所述预设的模型为逻辑回归模型、 梯度提升 树模型中的一种。 6.如权利要求4所述的方法, 其特征在于, 所述根据 预设的模型对所述目标数据进行特 征选择, 得到目标 特征, 具体为: 根据预设的评估准则, 对所述目标数据中各数据集中的目标字节进行逻辑计算, 得到 初始特征; 对所述初始特 征进行抽象化、 分箱和缩放处 理, 得到待选择 特征; 根据预设的模型对所述待选择 特征进行选择, 得到目标 特征。 7.如权利要求1所述的方法, 其特征在于, 根据所述目标特征建立风控模型, 并根据所 述历史用户的基本信息对所述 风控模型进行训练, 得到目标风控 模型步骤之后, 还 包括: 获取待审核用户的行程信息和初始信息, 所述初始信息中至少包括工作地 点; 识别所述行程信息中单月前往银 行或金融机构等非工作地 点的频率; 将所述评率高于预设阈值的待审核用户, 标记为潜在危险;权 利 要 求 书 1/2 页 2 CN 115393056 A 2将所述标记有潜在危险的待审核用户设置为携带有初始风险值。 8.如权利要求7所述的方法, 其特征在于, 所述获取待审核用户的初始信息, 并根据所 述目标风控 模型对所述待审核用户进行风控评估步骤之后, 还 包括: 根据所述目标风控 模型, 得到待审核用户的风险评估值; 并将所述初始风险值与所述 风险评估值叠加, 得到目标风险评估值。 9.一种基于大数据的用户信 息评估及风控装置, 其特征在于, 包括信 息获取模块、 去标 识化模块、 上传云端模块、 数据 清洗模块、 特征选择模块、 风控建模模块和风控评估模块, 其 中: 所述信息获取模块用于, 获取历史用户的基本信息, 所述基本信息分为用户信息和贷 款信息; 所述去标识化模块用于, 对所述基本信息进行去标识化处 理, 得到初始数据; 所述上传云端模块用于, 将所述初始数据上传并存 储至云端; 所述数据清洗模块用于, 在云端对所述初始数据进行 数据清洗处 理, 得到目标 数据; 所述特征选择模块用于, 根据预设的模型对所述目标数据进行特征选择, 得到目标特 征; 所述风控建模模块用于, 根据所述目标特征建立风控模型, 并根据所述历史用户的基 本信息对所述 风控模型进行训练, 得到目标风控 模型; 所述风控评估模块用于, 获取待审核用户的初始信息, 并根据所述目标风控模型对所 述待审核用户进行风控评估。 10.一种设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计算机程 序, 其特征在于, 所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述方法 的步骤。权 利 要 求 书 2/2 页 3 CN 115393056 A 3

PDF文档 专利 一种基于大数据的用户信息评估及风控方法、装置及设备

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于大数据的用户信息评估及风控方法、装置及设备 第 1 页 专利 一种基于大数据的用户信息评估及风控方法、装置及设备 第 2 页 专利 一种基于大数据的用户信息评估及风控方法、装置及设备 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:15:39上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。