金融行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211313328.X (22)申请日 2022.10.25 (71)申请人 维沃移动通信有限公司 地址 523863 广东省东莞 市长安镇维沃路1 号 (72)发明人 党博艺  (74)专利代理 机构 北京远志博慧知识产权代理 事务所 (特殊普通合伙) 11680 专利代理师 李翠雅 (51)Int.Cl. G06F 16/9535(2019.01) G06F 40/284(2020.01) G06F 40/30(2020.01) G06K 9/62(2022.01) (54)发明名称 内容推送方法、 装置、 电子设备和可读存储 介质 (57)摘要 本申请公开了一种内容推送方法、 装置、 电 子设备和可读存储介质, 属于通信技术领域, 该 方法包括: 获取N个原始数据集, N个原始数据集 中至少包括: 第一用户群体对历史推送内容的评 价数据、 目标用户的历史行为数据; 分别确定与N 个原始数据集一一对应的N个第一词集; 基于N个 第一词集之间, 语义匹配度大于或等于第一预设 匹配度的目标词, 确定向目标用户推送的目标推 送内容; 其中, 历史推送内容为历史向目标用户 所属的第一用户群体推送的内容, N为大于1的整 数。 权利要求书3页 说明书17页 附图3页 CN 115438269 A 2022.12.06 CN 115438269 A 1.一种内容推送方法, 其特 征在于, 所述方法包括: 获取N个原始数据集, N个所述原始数据集中至少包括: 第一用户群体对历史推送内容 的评价数据、 目标用户的历史行为数据; 分别确定与N个所述原 始数据集 一一对应的N个第一词集; 基于N个所述第 一词集之间, 语义匹配度 大于或等于第 一预设匹配度的目标词, 确定向 所述目标用户推送的目标推送内容; 其中, 所述历史推送内容为历史向所述目标用户所属的所述第一用户群体推送的内 容, N为大于1的整数。 2.根据权利要求1所述的方法, 其特征在于, 所述分别确定与N个所述原始数据集一一 对应的N个第一词集, 包括: 针对N个所述原始数据集中的任一个原始数据集, 以数据条为单位对所述原始数据集 中的数据进 行分词处理, 得到与所述原始数据集对应的关键词集, 所述关键词集包括: 至少 一组关键词, 每组关键词包括所述原 始数据集中的至少一条 数据中除停用词之外的词; 确定所述每组关键词中, 非情感词与情感词之间的目标关联参数, 所述目标关联参数 用于表征: 所述每组关键词中的非情感词与所述每组关键词中的情感词的情感关联程度; 基于所述目标关联参数, 从所述关键词集中确定与所述原始数据集对应的所述第 一词 集。 3.根据权利要求2所述的方法, 其特征在于, 所述关键词集中还包括: 所述至少一组关 键词中各关键词的词性信息; 所述确定所述每组关键词中, 非情感词与情感词之间的目标关联参数, 包括: 对于所述非情 感词和所述情 感词, 确定四个子关联参数, 所述四个子关联参数分别为: 所述非情感词 与所述情感词之 间的关联参数、 所述非情感词与所述情感词的词性信息之间 的关联参数、 所述非情感词的词性信息与所述情感词之间的关联参数、 所述非情感词的词 性信息与所述情感词的词性信息之间的关联参数; 根据所述四个子关联参数, 确定所述非情感词和所述情感词之间的所述目标关联参 数。 4.根据权利要求2所述的方法, 其特征在于, 所述基于所述目标关联参数, 从所述关键 词集中确定与所述原 始数据集对应的所述第一词集, 包括: 针对所述关键词集中的任一个非情感词, 若所述非情 感词对应的第 一参数值大于第 二 参数值, 则将所述非情感词确定为与所述原 始数据集对应的所述第一词集中的词; 其中, 所述第一参数值为至少一个第一关联参数的参数值之和, 所述第一关联参数包 括: 所述非情感词与所述关键词集中相应的正向情感词之间的目标关联参数; 所述第二参数值为至少一个第二关联参数的参数值之和, 所述第二关联参数包括: 所 述非情感词与所述关键词集中相应的负向情感词之间的目标关联参数。 5.根据权利要求1至4中任一项所述的方法, 其特征在于, 所述基于N个所述第 一词集之 间, 语义匹配度大于或等于第一预设匹配度的目标词, 确定 向所述目标用户推送的目标推 送内容, 包括: 针对第一推送内容中的每个第 一词, 若所述目标词中包括与第 一词之间的语义匹配度 大于或等于第二预设匹配度的至少一个第二词, 则将所述第一词替换为所述至少一个第二权 利 要 求 书 1/3 页 2 CN 115438269 A 2词中关注参数最大的第二词; 将完成词替换的第一推送内容, 作为所述目标推送内容; 其中, 所述第一推送内容为所述第一用户群体对应的候选推送内容; 词的关注参数用 于指示用户对词的关注度。 6.根据权利要求1所述的方法, 其特征在于, 所述获取N个原始数据集之后, 所述方法还 包括: 针对N个所述原始数据集中的任一个原始数据集, 对所述原始数据集中的数据进行预 处理, 得到与所述原始数据集对应的第二词集, 所述第二词集中包括所述原始数据集中的 所有非情感词; 针对所述第二词集中的每 个词, 根据词对应的场景参数, 确定所述词的重要程度值; 根据所述词的重要程度值和所述词在M个目标意图场景中的出现次数, 确定所述词的 关注参数; 其中, 所述场景参数包括: 所述词对应的出现场景数、 所述词在各出现场景中的出现次 数、 所述词在各 出现场景中的出现天数; 所述M个目标意图场景为按照原始数据量由高至低 排列的P个意图场景中的前M个意图 场景, 所述P个意图场景为所述历史推送内容对应的所有意图场景; M和P为正整 数, 且M小于 P。 7.一种内容推送装置, 其特 征在于, 所述装置包括: 获取模块和 确定模块; 所述获取模块, 用于获取N个原始数据集, N个所述原始数据集中至少包括: 第一用户群 体对历史推送内容的评价数据、 目标用户的历史行为数据; 所述确定模块, 用于分别确定与N个所述获取模块获取的所述原始数据集一一对应N个 第一词集; 所述确定模块, 还用于基于N个所述第一词集之间, 语义匹配度 大于或等于第 一预设匹 配度的目标词, 确定向所述目标用户推送的目标推送内容; 其中, 所述历史推送内容为历史向所述目标用户所属的所述第一用户群体推送的内 容, N为大于1的整数。 8.根据权利要求7 所述的装置, 其特 征在于, 所述确定模块, 具体用于: 针对N个所述原始数据集中的任一个原始数据集, 以数据条为单位对所述原始数据集 中的数据进 行分词处理, 得到与所述原始数据集对应的关键词集, 所述关键词集包括: 至少 一组关键词, 每组关键词包括所述原 始数据集中的至少一条 数据中除停用词之外的词; 确定所述每组关键词中, 非情感词与情感词之间的目标关联参数, 所述目标关联参数 用于表征: 所述每组关键词中的非情感词与所述每组关键词中的情感词的情感关联程度; 基于所述目标关联参数, 从所述关键词集中确定与所述原始数据集对应的所述第 一词 集。 9.根据权利要求8所述的装置, 其特征在于, 所述关键词集中还包括: 所述至少一组关 键词中各关键词的词性信息; 所述确定模块, 具体用于: 对于所述非情 感词和所述情 感词, 确定四个子关联参数, 所述四个子关联参数分别为: 所述非情感词 与所述情感词之 间的关联参数、 所述非情感词与所述情感词的词性信息之间权 利 要 求 书 2/3 页 3 CN 115438269 A 3

PDF文档 专利 内容推送方法、装置、电子设备和可读存储介质

文档预览
中文文档 24 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 内容推送方法、装置、电子设备和可读存储介质 第 1 页 专利 内容推送方法、装置、电子设备和可读存储介质 第 2 页 专利 内容推送方法、装置、电子设备和可读存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:04:11上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。