金融行业标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111671276.9 (22)申请日 2021.12.31 (71)申请人 科大讯飞股份有限公司 地址 230088 安徽省合肥市高新区望江西 路666号 (72)发明人 蒋磊 朱辉辉 张建树  (74)专利代理 机构 北京集佳知识产权代理有限 公司 11227 代理人 鲁梅 (51)Int.Cl. G06V 30/148(2022.01) G06K 9/62(2022.01) G06V 10/74(2022.01) G06V 10/774(2022.01) G06V 30/19(2022.01) (54)发明名称 一种字符识别方法、 装置、 设备及存 储介质 (57)摘要 本申请提出一种字符识别方法、 装置、 设备 及存储介质, 该方法包括: 获取文本图像的解码 特征, 并根据所述解码特征, 解码得到与所述文 本图像对应的第一字符识别结果; 通过将所述文 本图像的解码特征, 与预设字典 中的各个字符的 字符元素序列特征进行比对, 确定与所述文本图 像对应的第二字符识别结果; 其中, 所述字符元 素序列由字符的各个构成元素, 以及各个构成元 素之间的位置关系信息组成; 基于所述第一字 符 识别结果和所述第二字 符识别结果, 确定对所述 文本图像的字符识别结果。 采用上述方案能够取 得更好的字符识别效果。 权利要求书3页 说明书16页 附图4页 CN 114332871 A 2022.04.12 CN 114332871 A 1.一种字符识别方法, 其特 征在于, 包括: 获取文本 图像的解码特征, 并根据所述解码特征, 解码得到与所述文本 图像对应的第 一字符识别结果; 通过将所述文本图像的解码特征, 与预设字典中的各个字符的字符元素序列 特征进行 比对, 确定与所述文本图像对应的第二字符识别结果; 其中, 所述字符元素序列由字 符的各 个构成元 素, 以及各个构成元 素之间的位置关系信息组成; 基于所述第 一字符识别结果和所述第 二字符识别结果, 确定对所述文本图像的字符识 别结果。 2.根据权利要求1所述的方法, 其特征在于, 通过将所述文本 图像的解码特征, 与预设 字典中的各个字符的字符元素序列特征进 行比对, 确定与所述文本图像对应的第二字符识 别结果, 包括: 将所述解码特征输入预先训练 的结构解码模型, 使所述结构解码模型通过将所述文本 图像的解码特征, 与预设字典中的各个字符的字符元素序列特征进行比对, 确定与所述文 本图像对应的字符识别结果, 并将所述结构解码模型所确定的字符识别结果作为与所述文 本图像对应的第二字符识别结果。 3.根据权利要求1所述的方法, 其特征在于, 获取文本 图像的解码特征, 并根据所述解 码特征, 解码得到与所述文本图像对应的第一字符识别结果, 包括: 将文本图像输入预先训练的字符识别模型, 使所述字符识别模型对所述文本图像进行 特征提取及字符识别处理, 得到所述字符识别模型输出 的解码特征以及字符识别结果, 并 将所述字符识别模型输出的字符识别结果作为与所述文本图像对应的第一字符识别结果。 4.根据权利要求1所述的方法, 其特征在于, 所述第 一字符识别结果与 所述第二字符识 别结果中, 分别记录所述文本图像中的待识别字符被识别为预设字典中的各个字符的概 率; 基于所述第 一字符识别结果和所述第 二字符识别结果, 确定对所述文本图像的字符识 别结果, 包括: 将所述第一识别结果与所述第 二识别结果进行融合处理, 确定对所述文本图像的字符 识别结果。 5.根据权利要求4所述的方法, 其特征在于, 将所述第 一识别结果与 所述第二识别结果 进行融合处 理, 确定对所述文本图像的字符识别结果, 包括: 以所述第一字符识别结果的权重为第 一权重、 所述第 二字符识别结果的权重为第 二权 重, 对所述第一字符识别结果和所述第二字符识别结果进行加权求和, 确定所述文本图像 中的待识别字符被识别为预设字典中的各个字符的加权求和后的概 率; 根据所述文本图像中的待识别字符被识别为预设字典中的各个字符的加权求和后的 概率, 确定对所述文本图像的字符识别结果。 6.根据权利要求5所述的方法, 其特征在于, 所述第 一权重和所述第 二权重的大小按照 如下方式确定: 如果所述第 一字符识别结果中所记录的识别概率最大的字符, 是预先设置的形近字列 表中的字符, 则设置所述第二权重大于所述第一权重; 其中, 所述形近字列 表中存储字形相 近的字符对; 所述识别概率最大 的字符, 是待识别字符被识别为预设字典中的各个字符的权 利 要 求 书 1/3 页 2 CN 114332871 A 2概率中的最大概 率对应的字符; 如果所述第 一字符识别结果中所记录的识别概率最大的字符, 不是预先设置的形近字 列表中的字符, 则设置所述第二权 重不大于所述第一权 重。 7.根据权利要求1所述的方法, 其特征在于, 所述第 一字符识别结果与 所述第二字符识 别结果, 分别为对所述文本图像中的待识别字符进行识别得到的字符; 基于所述第 一字符识别结果和所述第 二字符识别结果, 确定对所述文本图像的字符识 别结果, 包括: 从所述第一字符识别结果和所述第 二字符识别结果中, 选出对所述文本图像的字符识 别结果。 8.根据权利要求7所述的方法, 其特征在于, 从所述第 一字符识别结果和所述第 二字符 识别结果中, 选出对所述文本图像的字符识别结果, 包括: 判断所述第一字符识别结果是否为预先设置的形近字列表中的字符; 其中, 所述形近 字列表中存 储字形相近的字符对; 如果所述第 一字符识别结果不是预先设置的形近字列表中的字符, 则将所述第 一字符 识别结果确定为对所述文本图像的字符识别结果; 如果所述第 一字符识别结果为预先设置的形近字列表中的字符, 则判断所述第 一字符 识别结果和所述第二字符识别结果构成的字符对是否为预先设置的形近字列表中的字符 对; 如果所述第一字符识别结果和所述第二字符识别结果构成的字符对是预先设置的形 近字列表中的字符对, 则将所述第二字符识别结果确定为对所述文本图像的字符识别结 果; 如果所述第一字符识别结果和所述第二字符识别结果构成的字符对不是预先设置的 形近字列 表中的字符对, 则将所述第一字符识别结果确定为对所述文本图像的字符识别结 果。 9.根据权利要求2所述的方法, 其特征在于, 所述结构解码模型通过如下方式训练得 到: 获取字符样本图像的解码特征, 以及所述字符样本图像对应的正样本标签的字符元素 序列特征和负样本标签的字符元 素序列特 征; 将所述字符样本图像的解码特征输入结构解码模型, 使所述结构解码模型通过将所述 字符样本图像的解码特征, 与字符样本集合中的各个字符的字符元素序列特征进行比对, 确定与所述字符样本图像对应的字符识别结果; 以使得所述结构解码模型所确定的所述字符样本图像的解码特征与所述字符样本图 像对应的正样本标签的字符元素序列特征的相似度最大化, 以及使得所述结构解码模型所 确定的所述字符样本图像的解码特征与所述字符样本图像对应的负样本标签的字符元素 序列特征的相似度最小化 为目标, 对所述结构解码模型进行参数优化。 10.根据权利要求9所述的方法, 其特征在于, 用于对所述结构解码模型进行训练的字 符样本包括 通过对字符的构成元 素进行替换 得到的字符。 11.根据权利要求1所述的方法, 其特征在于, 预设字典中的各个字符的字符元素序列 特征, 通过如下处 理得到:权 利 要 求 书 2/3 页 3 CN 114332871 A 3

.PDF文档 专利 一种字符识别方法、装置、设备及存储介质

文档预览
中文文档 24 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种字符识别方法、装置、设备及存储介质 第 1 页 专利 一种字符识别方法、装置、设备及存储介质 第 2 页 专利 一种字符识别方法、装置、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 02:04:00上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。