金融行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211046728.9 (22)申请日 2022.08.30 (71)申请人 中国银行股份有限公司 地址 100818 北京市西城区复兴门内大街1 号 (72)发明人 尹小敏 刘帅 卢忠民 高楷锐  (74)专利代理 机构 北京集佳知识产权代理有限 公司 11227 专利代理师 张东梅 (51)Int.Cl. G06F 40/194(2020.01) G06F 40/197(2020.01) G06Q 40/02(2012.01) (54)发明名称 文件对比方法、 装置、 存 储介质和设备 (57)摘要 本申请公开了一种文件对比方法、 装置、 存 储介质和设备, 应用于大数据领域, 该方法为: 基 于第一文件中的待检记录, 获得待检记录序列; 基于第二文件中的样本记录, 获得样本记录序 列; 将待检记录序列中第n位待检记录的每个可 比对信息项, 均标识为第一信息项, 并将样本记 录序列中第n位样本记录的每个模板信息项, 均 标识为第二信息项; 对于每个第一信息项, 将第 一信息项与符合预设条件的第二信息项进行比 对, 得到各个第一信息项的比对结果; 基于各个 第一信息项的比对结果, 生成第n位待检记录的 核对日志; 基于待检记录序列中每个待检记录的 核对日志, 构建第一文件的核对报告。 该方法无 需人工参与第一文件和第二文件的比对过程, 文 件比对效率较高。 权利要求书3页 说明书10页 附图5页 CN 115392212 A 2022.11.25 CN 115392212 A 1.一种文件 对比方法, 其特 征在于, 包括: 基于预先获取的第一文件中所包含的待检记录, 获得待检记录序列; 所述待检记录包 括多个可比对信息项; 基于预先获取的第二文件中所包含的样本记录, 获得样本记录序列; 所述样本记录包 括多个模板信息项; 每个所述模板信息项的名称与每个所述可比对信息项的名称一一对 应; 将所述待检记录序列中第 n位待检记录的每个可比对信 息项, 均标识为第 一信息项, 并 将所述样本记录序列中第n位样本记录的每个模板信息项, 均标识为第二信息项; n为正整 数; 对于每个所述第一信息项, 将所述第一信息项与符合预设条件的第二信息项进行比 对, 得到各个所述第一信息项的比对结果; 所述预设条件为: 第二信息项的名称与所述第一 信息项的名称对应; 基于各个所述第一信息项的比对结果, 生成所述第n 位待检记录的核对日志; 基于所述待检记录序列中每 个待检记录的核对日志, 构建所述第一文件的核对报告。 2.根据权利要求1所述的方法, 其特征在于, 所述基于预先获取的第 一文件中所包含的 待检记录, 获得待检记录序列, 包括: 将预先获取的第 一文件中任意一个待检记录所包含的各个信 息项进行分类, 得到可比 对信息项分组; 所述可比对信息项分组包括多个可比对信息项; 各个所述可比对信息项包 括银行号、 生成日期、 流水、 冲正标识、 客户账号; 按照第一排序规则, 对所述第 一文件中的各个待检记录进行排序, 得到待检记录序列; 所述第一排序规则为: 按照银行号从小到大的顺序, 对各个待检记录进 行排序, 且按照生成 日期从早到晚的顺序, 对银行号相同的多个待检记录进行排序, 且按照流水从高到的低的 顺序, 对银行号相同、 且生 成日期相同的多个待检记录进行排序, 且按照冲正标识 为冲正成 功排在冲正 失败的顺序, 对银行号相同、 且生 成日期相同、 且流水相同的多个待检记录进 行 排序, 且按照客户账号从小到大的顺序, 对银行号相同、 且生 成日期相同、 且流水相同、 且冲 正标识相同的多个待检记录进行排序。 3.根据权利要求1所述的方法, 其特征在于, 所述基于预先获取的第 二文件中所包含的 样本记录, 获得样本记录序列, 包括: 将预先获取的第 二文件中任意一个样本记录所包含的各个信 息项进行分类, 得到模板 信息项分组; 所述模板信息项分组包括多个模板信息项; 各个所述模板信息项包括银行号、 生成日期、 流水、 冲正标识、 客户账号; 按照第二排序规则, 对所述第 二文件中的各个样本记录进行排序, 得到样本记录序列; 所述第二排序规则为: 按照银行号从小到大的顺序, 对各个样本记录进 行排序, 且按照生成 日期从早到晚的顺序, 对银行号相同的多个样本记录进行排序, 且按照流水从高到的低的 顺序, 对银行号相同、 且生 成日期相同的多个样本记录进行排序, 且按照冲正标识 为冲正成 功排在冲正 失败的顺序, 对银行号相同、 且生 成日期相同、 且流水相同的多个样本记录进 行 排序, 且按照客户账号从小到大的顺序, 对银行号相同、 且生 成日期相同、 且流水相同、 且冲 正标识相同的多个样本记录进行排序。 4.根据权利要求1所述的方法, 其特征在于, 所述基于各个所述第一信息项的比对结权 利 要 求 书 1/3 页 2 CN 115392212 A 2果, 生成所述第n 位待检记录的核对日志, 包括: 基于各个所述第 一信息项的组合, 作为所述第 n位待检记录的唯一标识, 并基于各个所 述第一信息项的比对结果, 作为所述第n位待检记录的核对信息, 生成所述第n位待检记录 的核对日志。 5.根据权利要求1所述的方法, 其特征在于, 所述基于所述待检记录序列中每个待检记 录的核对日志, 构建所述第一文件的核对报告之后, 还 包括: 在确定各个所述第一信 息项的比对结果均为提示码的情况下, 将所述第 n位待检记录, 标识为正常记录; 所述提示码指示所述第一信息项与符合所述预设条件的第二信息项相 同; 在确定任意一个所述第 一信息项的比对结果为错误码的情况下, 将待检记录序列中第 n位待检记录, 标识 为非正常记录; 所述错误码指示所述第一信息项与符合所述预设条件的 第二信息项不相同; 统计所述待检记录序列中所包 含的待检记录的总数, 得到第一数值; 统计所述待检记录序列中所包 含的正常记录的总数, 得到第二数值; 统计所述待检记录序列中所包 含的非正常记录的总数, 得到第三数值; 将所述第 一数值、 所述第 二数值以及所述第三数值, 添加到所述核对报告中, 得到目标 核对报告, 并通过 预设前端界面向用户展示所述目标核对报告。 6.根据权利要求1所述的方法, 其特征在于, 所述待检记录还包括多个自检信息项, 以 及多个非空信息项; 所述基于所述待检记录序列中每个待检记录的核对日志, 构建所述第 一文件的核对报 告之后, 还 包括: 对于所述待检记录序列中的每个待检记录, 在确定所述待检记录的各个自检信 息项均 通过人工校验, 且各个非空信息项均通过非空检测的情况下, 将所述待检记录标识已检查 记录, 并获取每 个所述已检查记录的交易码; 在确定所述待检记录的任意一个自检信 息项还未通过人工校验, 且任意一个非空信 息 项还未通过非空检测的情况下, 将所述待检记录标识未检查记录, 并获取每个所述未检查 记录的交易码; 统计所述待检记录序列中所包 含的已检查记录的总数, 得到第四数值; 统计所述待检记录序列中所包 含的未检查记录的总数, 得到第五数值; 将所述第四数值、 所述第五数值、 每个所述已检查记录的交易码、 每个所述未检查记录 的交易码, 添加到所述核对报告中, 得到目标核对报告, 并通过预设前端界面向用户展示所 述目标核对报告。 7.一种文件 对比装置, 其特 征在于, 包括: 第一序列获取单元, 用于基于预先获取的第一文件中所包含的待检记录, 获得待检记 录序列; 所述待检记录包括多个可比对信息项; 第二序列获取单元, 用于基于预先获取的第二文件中所包含的样本记录, 获得样本记 录序列; 所述样本记录包括多个模板信息项; 每个所述模板信息项的名称与每个所述可比 对信息项的名称一 一对应; 标识单元, 用于将所述待检记录序列中第n位待检记录的每个可比对信息项, 均 标识为权 利 要 求 书 2/3 页 3 CN 115392212 A 3

PDF文档 专利 文件对比方法、装置、存储介质和设备

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 文件对比方法、装置、存储介质和设备 第 1 页 专利 文件对比方法、装置、存储介质和设备 第 2 页 专利 文件对比方法、装置、存储介质和设备 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:15:40上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。