金融行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211065023.1 (22)申请日 2022.09.01 (71)申请人 中国银行股份有限公司 地址 100818 北京市西城区复兴门内大街1 号 (72)发明人 张钰娜  (74)专利代理 机构 北京集佳知识产权代理有限 公司 11227 专利代理师 张雪娇 (51)Int.Cl. G06K 9/62(2022.01) G06Q 40/02(2012.01) (54)发明名称 客户流失预测方法及 装置、 存储介质及电子 设备 (57)摘要 本申请公开了一种客户流失预测方法及装 置、 存储介质及电子设备, 可应用于金融领域或 其他领域, 包括: 对采集的样本数据集中的各个 样本数据进行标准化处理, 得到各个标准样本数 据; 使用PCA算法对各个标准样本 数据进行处理, 提取各个特征数据; 使用各个特征数据对初始的 预测模型进行训练, 得到训练完成的预测模型; 将待预测客户数据输入训练完成的预测模型中, 使得该预测模型调用基学习器和次级学习器对 待预测客户数据进行处理, 输出客户流失预测结 果。 本发明使用Stacking集成算法构建预测模 型, Stacking集成算法可以集成多种预测的算 法, 由此使用多种预测的算法对客户流失进行预 测, 减少预测的误差, 提高预测的结果的准确率。 权利要求书2页 说明书10页 附图5页 CN 115392388 A 2022.11.25 CN 115392388 A 1.一种客户流失预测方法, 其特 征在于, 包括: 采集样本数据集, 所述样本数据集中包 含多个样本数据; 对所述样本数据集中的各个样本数据进行 标准化处理, 得到各个标准样本数据; 使用预设的PCA算法对各个所述标准样本数据进行处 理, 提取各个特征数据; 使用各个所述特征数据对初始 的预测模型进行训练, 得到训练完成的预测模型, 所述 预测模型中包含使用Stacking集成算法构建的基学习器和 使用Logistic回归算法构建的 次级学习器; 将待预测客户数据输入训练完成的预测模型中, 使得该预测模型调用基学习器和次级 学习器对所述待预测客户数据进行处 理, 输出客户流失预测结果。 2.根据权利要求1所述的方法, 其特征在于, 所述对所述样本数据集中的各个样本数据 进行标准化处理, 得到各个标准样本数据, 包括: 对所述样本数据集中的各个样本数据进行缺失值处 理, 得到各个第一处 理数据; 使用预设的One ‑hot编码对各个所述第一处 理数据进行处 理, 得到各个第二处 理数据; 对各个所述第二处 理数据进行归一 化处理, 得到各个第三处 理数据; 使用预设的SMOTE算法对各个所述第三处 理数据进行处 理, 得到各个标准样本数据。 3.根据权利要求2所述的方法, 其特征在于, 所述对所述样本数据集中的各个样本数据 进行缺失值处 理, 得到各个第一处 理数据, 包括: 统计所述样本数据集中存在缺失值的样本数据的数目, 并判断所述存在缺失值的样本 数据的数目是否小于预设数值; 当所述存在缺失值的样本数据的数目小于所述预设数值 时, 将各个存在缺失值的样本 数据从所述样本数据集中删除, 并将所述样本数据集中剩余的各个样本数据均确定为第一 处理数据; 当所述存在缺失值的样本数据的数目不小于所述预设数值 时, 将各个所述存在缺失值 的样本数据均确定为第一类数据, 将所述样本数据集中的剩余的各个样本数均确定为第二 类数据; 对各个所述第一类数据进行插补处 理, 得到各个第三类数据; 将各个所述第三类数据和各个所述第二类数据均确定为第一处 理数据。 4.根据权利要求1所述的方法, 其特 征在于, 还 包括: 基于所述 客户流失预测结果, 确定客户流失占比; 判断所述 客户流失占比是否大于预设占比; 当所述客户流失占比大于所述预测占比时, 将所述客户流失预测结果向预设的工作 人 员反馈; 当所述客户流失占比不大于所述预设占比时, 将所述客户流失预测结果保存至预设的 预测结果数据库。 5.一种客户流失预测装置, 其特 征在于, 包括: 采集单元, 用于采集样本数据集, 所述样本数据集中包 含多个样本数据; 处理单元, 用于对所述样本数据集中的各个样本数据进行标准化处理, 得到各个标准 样本数据; 提取单元, 用于使用预设的PCA算法对各个所述标准样本数据进行处理, 提取各个特征权 利 要 求 书 1/2 页 2 CN 115392388 A 2数据; 训练单元, 用于使用各个所述特征数据对初始 的预测模型进行训练, 得到训练完成的 预测模型, 所述预测模型中包含使用Stacking算法构建的基学习器和使用Logistic回归算 法构建的次级学习器; 输出单元, 用于将待预测客户数据输入训练完成的预测模型中, 使得该预测模型调用 基学习器和次级学习器对所述待预测客户数据进行处 理, 输出客户流失预测结果。 6.根据权利要求5所述的装置, 其特 征在于, 所述处 理单元, 包括: 第一处理子单元, 用于对所述样本数据集中的各个样本数据进行缺失值处理, 得到各 个第一处 理数据; 第二处理子单元, 用于使用预设的One ‑hot编码对各个所述第一处理数据进行处理, 得 到各个第二处 理数据; 第三处理子单元, 用于对各个所述第二处理数据进行归一化处理, 得到各个第三处理 数据; 第四处理子单元, 用于使用预设的SMOTE算法对各个所述第三处理数据进行处理, 得到 各个标准样本数据。 7.根据权利要求6所述的装置, 其特 征在于, 所述第一处 理子单元, 包括: 统计模块, 用于统计所述样本数据集中存在缺失值的样本数据的数目, 并判断所述存 在缺失值的样本数据的数目是否小于预设数值; 删除模块, 用于当所述存在缺失值的样本数据的数目小于所述预设数值时, 将各个存 在缺失值的样本数据从所述样本数据集中删除, 并将所述样本数据集中剩余的各个样本数 据均确定为第一处 理数据; 第一确定模块, 用于当所述存在缺失值的样本数据的数目不小于所述预设数值时, 将 各个所述存在缺 失值的样本数据均确定为第一类数据, 将所述样本数据集中的剩余的各个 样本数均确定为第二类数据; 插补处理模块, 用于对各个所述第一类数据进行插补处 理, 得到各个第三类数据; 第二确定模块, 用于将各个所述第 三类数据和各个所述第 二类数据均确定为第 一处理 数据。 8.根据权利要求5所述的装置, 其特 征在于, 还 包括: 确定单元, 用于基于所述 客户流失预测结果, 确定客户流失占比; 判断单元, 用于判断所述 客户流失占比是否大于预设占比; 反馈单元, 用于当所述客户流失占比大于所述预设占比时, 将所述客户流失预测结果 向预设的工作人员反馈; 保存单元, 用于当所述客户流失占比不大于所述预设占比时, 将所述客户流失预测结 果保存至预设的预测结果数据库。 9.一种存储介质, 其特征在于, 所述存储介质包括存储的指令, 其中, 在所述指令运行 时控制所述存 储介质所在的设备 执行如权利要求1 ‑4任意一项所述的客户流失预测方法。 10.一种电子设备, 其特征在于, 包括存储器, 以及一个或者一个以上的指令, 其中一个 或者一个以上指令存储于存储器中, 且经配置以由一个 或者一个以上 处理器执行如权利要 求1‑4任意一项所述的客户流失预测方法。权 利 要 求 书 2/2 页 3 CN 115392388 A 3

PDF文档 专利 客户流失预测方法及装置、存储介质及电子设备

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 客户流失预测方法及装置、存储介质及电子设备 第 1 页 专利 客户流失预测方法及装置、存储介质及电子设备 第 2 页 专利 客户流失预测方法及装置、存储介质及电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:15:37上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。