专利一种基于计算机视觉的字母文本识别方法

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111676538.0 (22)申请日 2021.12.31 (71)申请人陕西科技大学地址 710021 陕西省西安市未央区大学园区陕西科技大学 (72)发明人姚斌　赵杰　邓淑婷　何雨阳　魏玄颖　韩振　何立风　 (74)专利代理机构西安智大知识产权代理事务所 61215 代理人王晶 (51)Int.Cl. G06V 30/412(2022.01) G06V 30/413(2022.01) G06K 9/62(2022.01) G06V 10/74(2022.01) (54)发明名称一种基于计算机视觉的字母文本识别方法 (57)摘要本发明公开了一种基于计算机视觉的字母文本识别方法，包括终端对获取到得英文字符图像转换为二值图像；按照顺序扫描图像的像素并记录相应的图段数、相邻图段数以及图段长度：计算图像的欧拉数E并分类：对欧拉数相同的字符图像，根据字符图像不同位置的图段数、字符图像高度与宽度的比值、还有在图像的特定宽度位置增加前景色相同的直线后，判断新图像的孔洞数，进而对字符图像进行字母识别。本发明采用图像欧拉数和图像特定高度或宽度处的图段特征以及高度与宽度的比值相结合的方法实现对字母图像简单、快速地识别。权利要求书2页说明书5页附图8页 CN 114332891 A 2022.04.12 CN 114332891 A 1.一种基于计算机视觉的字母文本识别方法，其特征在于，包括以下步骤；步骤1：获取到得英文字符图像，并将其转换为二值图像；步骤2：按照从左到右、从下到上的顺序扫描二值图像的像素并记录相应的图段数、相邻图段数以及图段长度：步骤3：计算二值图像的欧拉数E并分类：步骤4：对欧拉数相同的字符图像，根据二值图像不同位置的图段数、字符图像高度与宽度的比值、还有在图像的特定宽度位置增加前景色相同的直线后，判断新图像的孔洞数，进而对字符图像进行字母识别。 2.根据权利要求1所述的一种基于计算机视觉的字母文本识别方法，其特征在于，所述步骤1中的英文字符图像，是基于现阶段正规论文中常用的西文字体格式 “Times New Roman”。 3.根据权利要求1所述的一种基于计算机视觉的字母文本识别方法，其特征在于，所述步骤1中终端对获取到的字符图像转换为二值图像具体为：终端对获取到的字符图像进行由彩色到灰度的转变、图像滤波去噪和二值化的操作，得到m行、 n列的二值图像。 4.根据权利要求1所述的一种基于计算机视觉的字母文本识别方法，其特征在于，所述步骤2中顺序扫描图像的像素并记录相应的图段数、相邻图段数以及图段长度，具体为：顺序扫描图像的第m行或n列(m＝1， 2， …， M)像素，记录第m行(或第n列)的图段数及第m ‑1行 (或第n‑1列)的图段形成的相邻图段数，同时记录图像的高度与宽度的比值，还有在二分之一高度处以及在字母图像的特定高度或宽度倍数处的图段数量。 5.根据权利要求1所述的一种基于计算机视觉的字母文本识别方法，其特征在于，所述步骤3中计算图像的欧拉数E并分类具体为：图像扫描完成后，累加图像的图段数NR和相邻图段数NBR，利用公式E＝NR‑NBR计算图像的欧拉数E，并根据图像的欧拉数对字符图像进行分类。 6.根据权利要求1所述的一种基于计算机视觉的字母文本识别方法，其特征在于，所述步骤4中图像宽度的倍数，是指对于字母字符图像的外接矩形的总宽度m，以从左向右为正方向，特定位置的图段像素列序数与总图段像素列的比值。 7.根据权利要求1所述的一种基于计算机视觉的字母文本识别方法，其特征在于，所述步骤4中在图像的特定高度或宽度位置增加前景色相同的直线判断新图像的孔洞数，是指在图像的二分之一宽度处增加一条不短于字符图像高度的直线，与原图像结合构成新图像，颜色与字符图像的前景色相同，新图像所具有的孔洞数将作为新的区分方法。 8.根据权利要求1所述的一种基于计算机视觉的字母文本识别方法，其特征在于，所述步骤4中对欧拉数相同的字符图像，根据字符图像的不同位置的图段数对其进行字母识别，具体为：当计算出的欧拉数为 ‑1，则判断该字符为字母 “B”，识别结束；当计算出的欧拉数不为1，则进一步判断，当计算出的欧拉数为0，则该字符对应六种字母： A、 D、 O、 P、 Q或R，继续计算字符图像高度与宽度的比值、图像高度倍数为0.20、 0.35、 0.49，以及图像宽度倍数为0.2 2的图段数进一步判断；当计算出的欧拉数不为 ‑1和0，则进一步判断，当计算出的欧拉数为1，则该字符对应19 种字母图像： C、 E、 F、 G、 H、 I、 J、 K、 L、 M、 N、 S、 T、 U、 V、 W、 X、 Y或Z，在这些图像的二分之一宽度处权　利　要　求　书 1/2 页 2 CN 114332891 A 2增加一条不短于字符图像高度的直线，与原图像结合构成新图像，颜色与字符图像的前景色相同，继续计算这些新图像具有的孔洞数并进行分类，同时计算原字符图像高度与宽度的比值，还有在二分之一高度处、二分之一宽度处以及图像高度倍数为0.06、 0.14、 0.15、 0.30、 0.33、 0.35、 0.63、 0.81，以及图像宽度倍数为0.14、 0.2 2处的图段数进一步判断；当计算出的欧拉数不为‑1、 0或1,则图像内容不是此种类字母字符，识别结束。 9.根据权利要求1所述的一种基于计算机视觉的字母文本识别方法，其特征在于，所述步骤4中字符图像高度与宽度的比值，是指每个图像的外接矩形的高度与宽度的比值。 10.根据权利要求1所述的一种基于计算机视觉的字母文本识别方法，其特征在于，所述图段是指二值图像的每一行中被背景或图像边界所分隔的单个或多个目标像素。权　利　要　求　书 2/2 页 3 CN 114332891 A 3

专利 一种基于计算机视觉的字母文本识别方法

专利一种基于计算机视觉的字母文本识别方法