金融行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210895990.4 (22)申请日 2022.07.26 (71)申请人 深圳华策辉弘科技有限公司 地址 518000 广东省深圳市福田区福田街 道岗厦社区金田路3088号中洲大厦 2601、 2602、 2603、 2606 (72)发明人 冯威  (74)专利代理 机构 广州三环 专利商标代理有限 公司 44202 专利代理师 黄禹强 (51)Int.Cl. G06V 10/774(2022.01) G06V 10/764(2022.01) G06V 10/44(2022.01) (54)发明名称 模型训练方法、 装置、 设备及可读存 储介质 (57)摘要 本申请实施例提出了一种模 型训练方法、 装 置、 设备及可读存储介质, 该方法包括: 获取样本 图像以及对应的第一标记框信息, 第一标记框信 息用于指示样本图像中的第一目标对象的位置 和相对于参考轴的旋转角度; 将样 本图像输入至 对象检测模 型, 得到多个候选框信息和多个预测 框信息, 预测框信息为对候选框信息进行位置回 归得到; 根据多个候选框信息和第一标记框信 息, 在多个预测框信息中确定第一预测框信息; 根据第一预测框信息、 第一候选框信息、 以及第 一标记框信息, 对对象检测模型进行训练, 以得 到目标对象检测模型。 通过本申请实施例, 有利 于目标对象检测模型输出图像中目标对象的位 置和旋转角度, 提高目标对象检测的准确性。 权利要求书2页 说明书18页 附图5页 CN 115205634 A 2022.10.18 CN 115205634 A 1.一种模型训练方法, 其特征在于, 应用于对象检测模型, 所述对象检测模型包括候选 框输出网络和回归输出网络; 所述方法包括: 获取样本 图像, 以及获取所述样本 图像对应的第一标记框信息, 所述第一标记框信息 用于指示所述样本图像中的第一目标对象的位置和相对于参 考轴的旋转角度; 将所述样本图像输入至所述对象检测模型, 以得到所述候选框输出网络输出的所述样 本图像对应的多个候选框信息和所述回归输出网络输出的所述多个候选框信息对应的多 个预测框信息, 所述候选框信息用于指示所述对象检测模型输出的所述第一目标对象的候 选位置和候选 旋转角度, 所述预测框信息为对所述 候选框信息进行位置回归得到; 根据所述多个候选框信 息和所述第 一标记框信 息, 在所述多个预测框信 息中确定第 一 预测框信息, 所述第一预测框信息对应的第一候选框信息所对应的候选框与所述第一标记 框信息对应的标记框的重合度大于预设阈值; 根据所述第 一预测框信 息与所述第一候选框信 息之间的第 一关系参数、 以及所述第 一 标记框信息与所述第一候选框信息之间的第二关系参数, 对所述对 象检测模型进行训练, 以得到目标对象检测模型。 2.根据权利要求1所述的方法, 其特征在于, 所述获取所述样本图像对应的第 一标记框 信息, 包括: 对所述样本图像中的第 一目标对象进行边界点标注, 并计算所述第 一目标对象的边界 点的最小外 接矩形; 将所述最小外接矩形的位置参数确定为所述样本图像对应的第 一标记框信 息, 所述最 小外接矩形 的位置参数包括所述最小外接矩形在所述样本图像中的位置和所述最小外接 矩形相对参 考轴的旋转角度。 3.根据权利要求1所述的方法, 其特征在于, 所述 回归输出网络包括位置回归 网络和分 类回归网络, 所述位置回归网络用于输出所述多个预测框信息, 所述分类回归网络用于输 出所述多个预测框信息各自对应的置信度; 所述根据 所述第一预测框信 息与所述第一候选框信 息之间的第 一关系参数、 以及所述 第一标记框信息与所述第一候选框信息之 间的第二关系参数, 对所述对象检测模型进 行训 练, 以得到目标对象检测模型, 包括: 根据所述第 一预测框信 息与所述第一候选框信 息之间的第 一关系参数、 以及所述第 一 标记框信息与所述第一候选框信息之 间的第二关系参数, 计算所述对象检测模型的第一损 失, 所述第一损失用于指示所述对象检测模型定位所述第一目标对象的位置的准确度; 根据所述多个预测框信息各自对应的置信度, 计算所述对象检测模型的第二损 失, 所 述第二损失用于指示所述对象检测模型分类的准确度; 根据所述第一损 失和所述第二损 失, 对所述对象检测模型进行迭代调参, 以得到所述 目标对象检测模型。 4.根据权利要求3所述的方法, 其特征在于, 所述根据所述第一损 失和所述第二损 失, 对所述对象检测模型进行迭代调参, 以得到所述目标对象检测模型, 包括: 根据所述第一损 失、 所述第二损 失以及所述第一预测框信息的数量, 计算所述对象检 测模型的总损失; 根据所述总损失, 对所述对象检测模型进行迭代调参, 以得到所述目标对象检测模型。权 利 要 求 书 1/2 页 2 CN 115205634 A 25.根据权利要求1 ‑4中任一项所述的方法, 其特征在于, 所述根据 所述多个候选框信 息 和所述第一标记框信息, 在所述多个预测框信息中确定第一预测框信息, 包括: 根据所述多个候选框信 息和所述第 一标记框信 息, 确定所述多个候选框信 息各自对应 的候选框与所述第一标记框信息对应的标记框之间的重合度; 将重合度大于所述预设阈值的候选 框确定为第一 候选框; 将所述第一 候选框对应的预测框所对应的预测框信息确定为所述第一预测框信息 。 6.根据权利要求1 ‑4中任一项所述的方法, 其特征在于, 所述对象检测模型还包括特征 提取网络, 所述特征提取网络用于对所述样本图像进行特征提取, 以得到所述样本图像对 应的特征图; 所述多个预测框信息包括多组预测框信息, 一组预测框信息包括一个特征图 中的一个特征点对应的多个预测框信息, 一个特征点对应的多个预测框信息中的任意两个 预测框信息不相匹配, 所述任意两个预测框信息不相匹配是指所述任意两个预测框信息对 应的两个预测框的尺寸 参数、 宽高比参数和旋转角度参数中的一个或者多个不同。 7.一种图像处 理方法, 其特 征在于, 所述方法包括: 获取待检测图像; 通过目标对象检测模型对所述待检测图像进行对象检测处理, 确定所述待检测图像中 的第二目标对象的第二标记框信息, 所述第二标记框信息用于指示所述第二目标对象在所 述待检测图像中的位置和相对于参考轴的旋转角度, 所述目标对象检测模 型为通过权利要 求1‑6任一项所述的模型训练方法得到; 根据所述第二标记框信息, 在所述待检测图像中针对所述第二目标对象添加标记框 。 8.一种处理装置, 其特征在于, 所述装置包括用以实现如权利要求1 ‑6中任一项所述的 模型训练方法的模块, 或者, 包括用以实现如权利要求7 所述的图像处 理方法的模块。 9.一种计算机设备, 其特征在于, 包括: 处理器、 存储装置和通信接口, 所述处理器、 所 述通信接口和所述存储装置相互连接, 其中, 所述存储装置存储有 可执行程序 代码, 所述处 理器用于调用所述可执行程序代码, 用以实现如权利要求1 ‑6中任一项所述的模型训练方 法, 或者, 包括用以实现如权利要求7 所述的图像处 理方法。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有计算机程 序, 所述计算机程序包括程序指令, 所述程序指令被处理器执行, 用以实现如权利要求1 ‑6 中任一项所述的模型训练方法, 或者, 用以实现如权利要求7 所述的图像处 理方法的模块。权 利 要 求 书 2/2 页 3 CN 115205634 A 3

PDF文档 专利 模型训练方法、装置、设备及可读存储介质

文档预览
中文文档 26 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共26页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 模型训练方法、装置、设备及可读存储介质 第 1 页 专利 模型训练方法、装置、设备及可读存储介质 第 2 页 专利 模型训练方法、装置、设备及可读存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:42:38上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。