金融行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210906433.8 (22)申请日 2022.07.29 (71)申请人 平安科技 (深圳) 有限公司 地址 518000 广东省深圳市福田区福田街 道福安社区益田路5033号平 安金融中 心23楼 (72)发明人 刘杰 王健宗  (74)专利代理 机构 广州嘉权专利商标事务所有 限公司 4 4205 专利代理师 廖慧贤 (51)Int.Cl. G06F 16/71(2019.01) G06F 16/75(2019.01) G06F 16/78(2019.01) G06F 16/783(2019.01)G06N 3/04(2006.01) G06N 3/08(2006.01) G06V 10/44(2022.01) G06V 10/764(2022.01) G06V 10/82(2022.01) (54)发明名称 模型训练方法和装置、 视频搜索方法和装 置、 设备及 介质 (57)摘要 本申请实施例提供了一种模型训练方法和 装置、 视频搜索方法和装置、 设备及介质, 属于人 工智能技术领域。 该方法包括: 获取训练视频数 据集; 其中, 所述训练视频数据集包括至少两个 训练视频数据; 对每一所述训练视频数据进行特 征提取, 得到至少两个视频帧特征序列; 将所述 至少两个所述视频帧特征序列进行索引转换, 得 到至少两个视频索引序列; 根据所述至少两个视 频索引序列对所述至少两个训练视频数据进行 分类处理, 得到视频标识; 根据所述视频标识和 所述训练视频数据集对预设的自监督学习模型 进行训练, 得到数据转换模型。 本申请实施例能 够构建精度更高的数据转换模型。 权利要求书2页 说明书14页 附图5页 CN 115238123 A 2022.10.25 CN 115238123 A 1.一种模型训练方法, 其特 征在于, 所述方法包括: 获取训练视频 数据集; 其中, 所述训练视频 数据集包括至少两个训练视频 数据; 对每一所述训练视频 数据进行 特征提取, 得到 至少两个视频帧特 征序列; 将所述至少两个所述视频帧特 征序列进行索引转换, 得到 至少两个视频索引序列; 根据所述至少两个视频索引序列对所述至少两个训练视频数据进行分类处理, 得到视 频标识; 根据所述视频标识和所述训练视频数据集对预设的自监督学习 模型进行训练, 得到数 据转换模型。 2.根据权利要求1所述的方法, 其特征在于, 每一所述训练视频数据包括至少两个视频 帧, 所述对每一所述训练视频 数据进行 特征提取, 得到 至少两个视频帧特 征序列, 包括: 对每一个所述视频帧进行 特征提取, 得到 视频帧特 征; 将所述训练视频数据的每一所述视频帧特征进行特征序列转换, 得到至少两个视频帧 特征序列。 3.根据权利要求2所述的方法, 其特征在于, 所述对每一个所述视频帧进行特征提取, 得到视频帧特 征, 包括: 通过全局分层编码器对每一所述视频帧进行编码处 理, 得到全局视频级别特 征; 通过后向分层编码器对所述全局视频级别特征进行编码处理, 得到逆向视频框架特 征; 通过双向分层解码器对所述逆向视频框架特 征进行解码处 理, 得到框架级别特 征; 通过前向分层编码器对所述框架级别特 征进行编码处 理, 得到所述视频帧特 征。 4.根据权利要求3所述的方法, 其特征在于, 所述双 向分层解码器包括: 单向卷积层和 双向卷积层, 所述通过所述双向分层解码器对所述逆向视频框架特征进行解码处理, 得到 框架级别特 征, 包括: 通过所述单向卷积层对所述逆向视频框架特 征进行卷积处理, 得到卷积数据; 通过所述双向卷积层对所述卷积数据进行 卷积处理, 得到所述框架级别特 征。 5.根据权利要求1至4任一项所述的方法, 其特征在于, 所述将所述至少两个所述视频 帧特征序列进行索引转换, 得到 至少两个视频索引序列, 包括: 将所述至少两个所述视频帧特 征序列进行均值池化处 理, 得到视频级信息; 根据预设的邻域 函数对所述视频级信息进行邻域计算, 得到邻域结构; 根据所述邻域结构对所述至少两个所述视频帧特征序列进行索引转换, 得到所述至少 两个视频索引序列。 6.一种视频搜索方法, 其特 征在于, 所述方法包括: 获取原始视频数据; 将所述原始视频数据输入数据转换模型; 其中, 所述数据转换模型由权利要求1至5任 一项所述的模型训练方法得到; 通过所述数据转换模型将所述原 始视频数据进行 数据转换, 得到 视频序列数据; 获取查询信息; 根据所述 查询信息从至少两个所述视频序列数据中筛 选出目标序列数据; 根据所述目标序列数据从至少两个所述原 始视频数据中筛 选出目标视频 数据。权 利 要 求 书 1/2 页 2 CN 115238123 A 27.根据权利要求6所述的方法, 其特征在于, 所述根据所述查询信 息从至少两个所述视 频序列数据中筛 选出目标序列数据, 包括: 对所述查询信息进行二进制转换, 得到查询序列; 根据所述 查询序列从至少两个所述视频序列数据中筛 选出所述目标序列数据。 8.一种模型训练装置, 其特 征在于, 所述装置包括: 数据获取模块, 用于获取训练视频数据集; 其中, 所述训练视频数据集包括至少两个训 练视频数据; 提取模块, 用于对每一所述训练视频数据进行特征提取, 得到至少两个视频帧特征序 列; 索引转换模块, 用于将所述至少两个所述视频帧特征序列进行索引转换, 得到至少两 个视频索引序列; 分类模块, 用于根据 所述至少两个视频索引序列对所述至少两个训练视频数据进行分 类处理, 得到视频标识; 训练模块, 用于根据 所述视频标识和所述训练视频数据集对预设的自监督学习 模型进 行训练, 得到数据转换模型。 9.一种电子设备, 其特征在于, 所述电子设备包括存储器、 处理器、 存储在所述存储器 上并可在所述处理器上运行的程序以及用于实现所述处理器和所述存储器之间的连接通 信的数据总线, 所述程序被所述处理器执行时实现如权利要求1至5任一项所述的方法的步 骤, 或者如权利要求6 至7任一项所述的方法的步骤。 10.一种存储介质, 所述存储介质为计算机可读存储介质, 用于计算机可读存储, 其特 征在于, 所述存储介质存储有一个或者多个程序, 所述一个或者多个程序可被一个或者多 个处理器执行, 以实现如权利要求1至5任一项所述的方法的步骤, 或者如权利要求6至7任 一项所述的方法的步骤。权 利 要 求 书 2/2 页 3 CN 115238123 A 3

PDF文档 专利 模型训练方法和装置、视频搜索方法和装置、设备及介质

文档预览
中文文档 22 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 模型训练方法和装置、视频搜索方法和装置、设备及介质 第 1 页 专利 模型训练方法和装置、视频搜索方法和装置、设备及介质 第 2 页 专利 模型训练方法和装置、视频搜索方法和装置、设备及介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:42:34上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。