金融行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210387676.5 (22)申请日 2022.04.14 (71)申请人 游密科技 (深圳) 有限公司 地址 518051 广东省深圳市南 山区粤海街 道科技园社区科苑路16号东方科技大 厦2401 (72)发明人 崔洋洋 余俊澎  (74)专利代理 机构 华进联合专利商标代理有限 公司 44224 专利代理师 帅梦媛 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/332(2019.01) G06F 16/33(2019.01) G06F 16/335(2019.01)G06F 40/295(2020.01) G06F 40/30(2020.01) G06V 20/40(2022.01) G06V 20/62(2022.01) G06V 30/148(2022.01) (54)发明名称 问答方法、 装置、 计算机设备和存 储介质 (57)摘要 本申请涉及一种问答方法、 装置、 计算机设 备、 存储介质和计算机程序产品。 所述方法包括: 获取待处理问题及待处理问题的目标数据类型; 从预先设定的知识 图谱数据库中确定与 目标数 据类型对应的目标数据库; 分别对待处理问题和 目标数据库中的数据进行语义特征提取, 对应得 到第一语义特征和第二语义特征; 将第一语义特 征和第二语义特征进行相似度比较; 将不小于预 设阈值的相似度在目标数据库中对应的数据, 确 定为待处理问题对应的答案。 其中, 通过根据待 处理问题的目标数据类型确定答案, 不仅实现了 用户通过不同数据类型的待处理问题进行搜索 以及答案反馈, 还提高了在知识图谱 数据库中查 找答案的速度和效率, 进而提高了答案的显示速 度。 权利要求书2页 说明书12页 附图5页 CN 114817559 A 2022.07.29 CN 114817559 A 1.一种问答方法, 其特 征在于, 所述方法包括: 获取待处 理问题及所述待处 理问题的目标 数据类型; 从预先设定的知识图谱数据库中确定与所述目标 数据类型对应的目标 数据库; 分别对所述待处理问题和所述目标数据库中的数据进行语义特征提取, 对应得到第 一 语义特征和第二语义特 征; 将所述第一语义特 征和所述第二语义特 征进行相似度比较; 将不小于预设阈值的相似度在所述目标数据库中对应的数据, 确定为所述待处理问题 对应的答案 。 2.根据权利要求1所述的方法, 其特征在于, 所述将所述第 一语义特征和所述第 二语义 特征进行相似度比较, 包括: 获取所述第一语义特 征的第一哈希值和所述第二语义特 征的第二哈希值; 确定所述第一哈希值和所述第二哈希值之间的汉明距离; 根据所述汉明距离确定所述第一语义特 征和所述第二语义特 征之间的相似度。 3.根据权利要求1所述的方法, 其特 征在于, 所述目标 数据类型包括图像、 音频或文本 。 4.根据权利要求3所述的方法, 其特 征在于, 所述方法还 包括: 获取视频 数据; 从所述视频 数据中提取图像数据、 文本数据和音频 数据; 根据所述图像数据、 所述文本数据和所述音频 数据生成知识图谱; 基于所述知识图谱、 所述图像数据、 所述文本数据和所述音频数据, 在所述知识图谱数 据库中生成不同数据类型对应的数据库。 5.根据权利要求 4所述的方法, 其特 征在于, 所述文本数据的提取 过程, 包括: 确定所述视频 数据的每一视频帧的文字区域; 截取所述文字区域对应的图像; 对截取得到的图像进行光学字符识别, 得到所述文本数据。 6.根据权利要求4所述的方法, 其特征在于, 所述根据所述图像数据、 所述文本数据和 所述音频 数据生成知识图谱, 包括: 将所述图像数据和所述音频 数据转换为文字数据; 对所述文本数据和所述文字数据进行命名实体识别, 得到所述知识图谱的多个实体; 根据所述多个实体生成所述知识图谱。 7.根据权利要求6所述的方法, 其特征在于, 所述数据类型包括图像、 文本或音频, 所述 基于所述知识图谱、 所述图像数据、 所述文本数据和所述音频数据, 在所述知识图谱数据库 中生成不同数据类型对应的数据库, 包括: 从所述知识图谱中确定与 所述图像数据对应的第 一实体、 与 所述文本数据对应的第 二 实体和与所述音频 数据对应的第三实体; 根据所述图像数据和所述第一实体在所述知识图谱数据库中生成数据类型为图像时 对应的数据库; 根据所述文本数据和所述第二实体在所述知识图谱数据库中生成数据类型为文本时 对应的数据库; 根据所述音频数据和所述第三实体在所述知识图谱数据库中生成数据类型为音频时权 利 要 求 书 1/2 页 2 CN 114817559 A 2对应的数据库。 8.一种问答装置, 其特 征在于, 所述装置包括: 数据获取模块, 用于获取待处 理问题及所述待处 理问题的目标 数据类型; 数据库筛选模块, 用于从预先设定的知识图谱数据库中确定与 所述目标数据类型对应 的目标数据库; 特征提取模块, 用于分别对所述待处理问题和所述目标数据库中的数据进行语义特征 提取, 对应得到第一语义特 征和第二语义特 征; 相似度比较模块, 用于将所述第一语义特 征和所述第二语义特 征进行相似度比较; 答案确定模块, 用于将不小于预设阈值的相似度在所述目标数据库中对应的数据, 确 定为所述待处 理问题对应的答案 。 9.一种计算机设备, 包括存储器和处理器, 所述存储器存储有计算机程序, 其特征在 于, 所述处 理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序 被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。权 利 要 求 书 2/2 页 3 CN 114817559 A 3

.PDF文档 专利 问答方法、装置、计算机设备和存储介质

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 问答方法、装置、计算机设备和存储介质 第 1 页 专利 问答方法、装置、计算机设备和存储介质 第 2 页 专利 问答方法、装置、计算机设备和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 09:00:32上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。