金融行业标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111676538.0 (22)申请日 2021.12.31 (71)申请人 陕西科技大 学 地址 710021 陕西省西安市未央区大 学园 区陕西科技大 学 (72)发明人 姚斌 赵杰 邓淑婷 何雨阳  魏玄颖 韩振 何立风  (74)专利代理 机构 西安智大知识产权代理事务 所 61215 代理人 王晶 (51)Int.Cl. G06V 30/412(2022.01) G06V 30/413(2022.01) G06K 9/62(2022.01) G06V 10/74(2022.01) (54)发明名称 一种基于计算机视觉的字母 文本识别方法 (57)摘要 本发明公开了一种基于计算机视觉的字母 文本识别方法, 包括终端对获取到得英文字符图 像转换为二值图像; 按照顺序扫描图像的像素并 记录相应的图段数、 相邻图段数 以及图段长度: 计算图像的欧拉数E并分类: 对欧拉数相同的字 符图像, 根据字符图像不同位置的图段数、 字符 图像高度与宽度的比值、 还有在图像的特定宽度 位置增加前景色相同的直线后, 判断新图像的孔 洞数, 进而对字符图像进行字母识别。 本发明采 用图像欧拉数和图像特定高度或宽度处的图段 特征以及高度与宽度的比值相结合的方法实现 对字母图像简单、 快速地识别。 权利要求书2页 说明书5页 附图8页 CN 114332891 A 2022.04.12 CN 114332891 A 1.一种基于计算机 视觉的字母文本识别方法, 其特 征在于, 包括以下步骤; 步骤1: 获取到得英文字符图像, 并将其 转换为二值图像; 步骤2: 按照从左到右、 从下到上的顺序扫描二值图像的像素并记录相应的图段数、 相 邻图段数以及图段长度: 步骤3: 计算 二值图像的欧拉数E并分类: 步骤4: 对欧拉数相同的字符图像, 根据二值图像不同位置的图段数、 字符图像高度与 宽度的比值、 还有在图像的特定宽度位置增加前景色相同的直线后, 判断新图像的孔洞数, 进而对字符图像进行字母识别。 2.根据权利要求1所述的一种基于计算机视觉的字母文本识别方法, 其特征在于, 所述 步骤1中的英文字符图像, 是基于现阶段正规论文中常用的西文字体格式 “Times New  Roman”。 3.根据权利要求1所述的一种基于计算机视觉的字母文本识别方法, 其特征在于, 所述 步骤1中终端对获取到的字符图像转换为二值图像具体为: 终端对获取到的字符图像进行 由彩色到灰度的转变、 图像滤波 去噪和二 值化的操作, 得到m行、 n列的二 值图像。 4.根据权利要求1所述的一种基于计算机视觉的字母文本识别方法, 其特征在于, 所述 步骤2中顺序扫描图像的像素并记录相应的图段数、 相邻图段数以及图段长度, 具体为: 顺 序扫描图像的第m行或n列(m=1, 2, …, M)像素, 记录第m行(或第n列)的图段数及第m ‑1行 (或第n‑1列)的图段形成的相 邻图段数, 同时记录图像的高度与宽度的比值, 还有在二分之 一高度处以及 在字母图像的特定高度或宽度倍数处的图段 数量。 5.根据权利要求1所述的一种基于计算机视觉的字母文本识别方法, 其特征在于, 所述 步骤3中计算图像的欧拉数E并分类具体为: 图像扫描完成后, 累加图像的图段数NR和相邻 图段数NBR, 利用公 式E=NR‑NBR计算图像的欧拉数E, 并根据图像的欧拉数对字 符图像进行 分类。 6.根据权利要求1所述的一种基于计算机视觉的字母文本识别方法, 其特征在于, 所述 步骤4中图像宽度的倍数, 是指对于字母字符图像的外接矩形的总宽度m, 以从左向右为正 方向, 特定位置的图段像素列序数与总图段像素列的比值。 7.根据权利要求1所述的一种基于计算机视觉的字母文本识别方法, 其特征在于, 所述 步骤4中在图像的特定高度或宽度位置增加前景色相同的直线判断新图像的孔洞数, 是指 在图像的二分之一宽度处增加一条不短于字符图像高度的直线, 与原图像结合构成新图 像, 颜色与字符图像的前 景色相同, 新图像所 具有的孔洞数将作为 新的区分方法。 8.根据权利要求1所述的一种基于计算机视觉的字母文本识别方法, 其特征在于, 所述 步骤4中对欧拉数相同的字符图像, 根据字 符图像的不同位置的图段数对其进 行字母识别, 具体为: 当计算出的欧拉数为 ‑1, 则判断该字符为字母 “B”, 识别结束; 当计算出的欧拉数不为1, 则进一步判断, 当计算出的欧拉数为0, 则该字符对应六种字 母: A、 D、 O、 P、 Q或R, 继续计算字符图像高度与宽度的比值、 图像高度倍数为0.20、 0.35、 0.49, 以及图像宽度倍数为0.2 2的图段数进一步判断; 当计算出的欧拉数不为 ‑1和0, 则进一步判断, 当计算出的欧拉数为1, 则该字符对应19 种字母图像: C、 E、 F、 G、 H、 I、 J、 K、 L、 M、 N、 S、 T、 U、 V、 W、 X、 Y或Z, 在这些图像的二分之一宽度处权 利 要 求 书 1/2 页 2 CN 114332891 A 2增加一条不短于字符图像高度的直线, 与原图像结合构成新图像, 颜色与字符图像的前景 色相同, 继续计算这些新图像具有的孔洞数并进行分类, 同时计算原字符图像高度与宽度 的比值, 还有在二分之一高度处、 二分之一宽度处以及图像高度倍数为0.06、 0.14、 0.15、 0.30、 0.33、 0.35、 0.63、 0.81, 以及图像宽度倍数为0.14、 0.2 2处的图段 数进一步判断; 当计算出的欧拉数不 为‑1、 0或1,则图像内容 不是此种类字母字符, 识别结束。 9.根据权利要求1所述的一种基于计算机视觉的字母文本识别方法, 其特征在于, 所述 步骤4中字符图像高度与宽度的比值, 是指每 个图像的外 接矩形的高度与宽度的比值。 10.根据权利要求1所述的一种基于计算机视觉的字母文本识别方法, 其特征在于, 所 述图段是指二值图像的每一行中被背景或图像边界所分隔的单个或多个目标像素。权 利 要 求 书 2/2 页 3 CN 114332891 A 3

.PDF文档 专利 一种基于计算机视觉的字母文本识别方法

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于计算机视觉的字母文本识别方法 第 1 页 专利 一种基于计算机视觉的字母文本识别方法 第 2 页 专利 一种基于计算机视觉的字母文本识别方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 02:03:55上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。