金融行业标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111677667.1 (22)申请日 2021.12.31 (71)申请人 科大讯飞股份有限公司 地址 230000 安徽省合肥市高新 开发区望 江西路666号 (72)发明人 李超  (74)专利代理 机构 深圳市力道知识产权代理事 务所(普通 合伙) 44507 代理人 何姣 (51)Int.Cl. G06V 30/412(2022.01) G06K 9/62(2022.01) G06V 10/764(2022.01) G06V 10/774(2022.01) G06V 10/56(2022.01)G06V 10/40(2022.01) (54)发明名称 答题卡填涂识别方法、 模型构建方法、 设备 及存储介质 (57)摘要 本申请提供一种填涂识别模 型的构建方法、 答题卡填涂识别方法、 计算机设备及存储介质, 其中, 该识别方法包括: 获取待识别的答题卡对 应的图像; 获取所述图像中填涂选项图像的目标 特征参数, 其中, 所述目标特征参数包括图像底 色、 填涂选项色深、 填涂选项 填充率、 填涂题目最 小色深和填涂题目类型; 将所述填涂选项图像的 目标特征参数输入至填涂识别模 型进行识别, 得 到填涂选项结果。 由此可以提高填涂模识别模型 的准确率, 进而可以提高答题 卡填涂识别的准确 率。 权利要求书2页 说明书12页 附图7页 CN 114359936 A 2022.04.15 CN 114359936 A 1.一种答题卡 填涂识别方法, 其特 征在于, 所述方法包括: 获取待识别的答题卡对应的图像; 获取所述图像中填涂选项图像的目标特征参数, 其中, 所述目标特征参数包括图像底 色、 填涂选项色深、 填涂 选项填充率、 填涂题目最小色深和填涂题目类型; 将所述填涂选项图像的目标特征参数输入至填涂识别模型进行识别, 得到填涂选项结 果, 其中, 所述 填涂识别模型 是根据所述目标 特征参数构建得到的。 2.根据权利要求1所述的方法, 其特征在于, 所述填涂识别模型包括第 一识别模型和第 二识别模型, 所述第一识别模型为神经网络模型, 所述第二识别模型为支持向量机模型。 3.根据权利要求2所述的方法, 其特征在于, 所述将所述填涂选项图像的目标特征参数 输入至填涂识别模型进行识别, 包括: 将所述图像中填涂选项图像的目标特征参数输入至所述第 一识别模型, 得到第 一识别 结果; 将所述图像中填涂选项图像的目标特征参数输入至所述第 二识别模型, 得到第 二识别 结果; 根据所述第一识别结果和第二识别结果得到填涂 选项结果。 4.根据权利要求2所述的方法, 其特征在于, 所述第一识别模型还输出第一可信度, 所 述第二识别模型还输出第二可信度; 其中, 所述第一可信度根据所述第一识别模型的输出概率和判别真值确定; 所述第二 可信度为图像特征参数点距离分隔平面的距离, 所述图像特征参数点为图像底色、 填涂选 项色深、 填涂选项填充率、 填涂题目最小色深和填涂题目类型组成的向量, 所述分割平面根 据所述支持向量机模型的分割平面方程确定 。 5.一种填涂识别模型的构建方法, 其特 征在于, 所述方法包括: 获取训练样本数据, 其中, 所述训练样本数据包括多个填涂选项图像以及每个所述填 涂选项图像对应的标注结果, 每个所述填涂选项图像对应有目标目标特征参数, 所述 目标 特征参数包括图像底色、 填涂选项色深、 填涂选项填充率、 填涂题目最小色深和填涂题目类 型; 将所述填涂选项图像对应的目标特征参数和标注结果, 输入至待构建的填涂识别模型 进行模型训练, 得到构建好的填涂识别模型。 6.根据权利要求5所述的方法, 其特 征在于, 所述方法还 包括: 对所述训练样本数据中的填涂 选项图像进行 特征提取, 得到所述目标 特征参数; 其中, 所述目标特征参数用于构建填涂识别模型, 所述目标特征参数至少包括图像底 色、 填涂选项色深、 填涂 选项填充率、 填涂题目最小色深和填涂题目类型。 7.根据权利要求6所述的方法, 其特征在于, 所述对所述训练样本数据中的填涂选项图 像进行特征提取, 得到所述目标 特征参数, 包括: 计算所有训练样本数据在标注结果上的信息增益; 针对每一目标 特征参数在子数据集中分别计算 其在标注结果上的信息熵; 计算所有训练样本数据的信 息增益与所述目标特征参数的信 息熵的差值, 得到所述目 标特征参数的信息增益; 根据所述目标 特征参数的信息增益进行排序, 并基于排序结果确定目标 特征参数。权 利 要 求 书 1/2 页 2 CN 114359936 A 28.根据权利要求5所述的方法, 其特 征在于, 所述方法还 包括: 根据所述目标 特征参数对所述训练样本数据进行分组, 得到多组样本数据; 获取所述目标特征参数在每组样本数据中出现在第一标注结果对应的第一次数以及 出现在第二标注结果对应的第二次数, 其中, 所述第一标注结果为有效填涂, 所述第二标注 结果为无效填涂; 根据所述第一次数和第二次数的次数差, 确定是否滤除该组样本数据。 9.根据权利要求5 ‑8任一项所述的方法, 其特征在于, 所述填涂识别模型包括第 一识别 模型和第二识别模型, 所述第一识别模型为神经网络模型, 所述第二识别模型为支持向量 机模型; 所述将所述填涂选项图像对应的目标特征参数和标注结果, 输入至待构建的填涂识别 模型进行模型训练, 包括: 将所述填涂选项图像对应的目标特征参数和标注结果, 输入至待构建的第 一识别模型 进行模型训练, 得到构建好的第一识别模型; 将所述填涂选项图像对应的目标特征参数和标注结果, 输入至待构建的第 二识别模型 进行模型训练, 得到构建好的第二识别模型; 利用构建好的第一识别模型和第二识别模型, 构建填涂识别模型。 10.根据权利要求9所述的方法, 其特征在于, 所述第 一识别模型还输出第 一可信度, 所 述第二识别模型还输出第二可信度; 其中, 所述第一可信度根据所述第一识别模型的输出概率和判别真值确定; 所述第二 可信度为图像特征参数点距离分隔平面的距离, 所述图像特征参数点为图像底色、 填涂选 项色深、 填涂选项填充率、 填涂题目最小色深和填涂题目类型组成的向量, 所述分割平面根 据所述支持向量机模型的分割平面方程确定 。 11.一种计算机设备, 其特 征在于, 所述计算机设备包括: 存储器和处 理器; 其中, 所述存 储器与所述处 理器连接, 用于存 储程序; 所述处理器用于通过运行所述存储器中存储的程序, 实现如权利要求1 ‑4任一项所述 的答题卡填涂识别方法的步骤, 或, 实现如权利要求5 ‑10中任一项所述的填涂识别模型的 构建方法的步骤。 12.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有计算机程 序, 所述计算机程序被处理器执行时使所述处理器实现如权利要求1 ‑4任一项所述的答题 卡填涂识别方法的步骤, 或, 实现如权利要求5 ‑10中任一项所述的填涂识别模型的构建方 法的步骤。权 利 要 求 书 2/2 页 3 CN 114359936 A 3

.PDF文档 专利 答题卡填涂识别方法、模型构建方法、设备及存储介质

文档预览
中文文档 22 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 答题卡填涂识别方法、模型构建方法、设备及存储介质 第 1 页 专利 答题卡填涂识别方法、模型构建方法、设备及存储介质 第 2 页 专利 答题卡填涂识别方法、模型构建方法、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 02:05:36上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。