金融行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211272082.6 (22)申请日 2022.10.18 (71)申请人 南京众智维信息科技有限公司 地址 211300 江苏省南京市高淳区龙井路3 号 (72)发明人 车洵 孙捷 金奎 胡牧 孙翰墨  程佳  (74)专利代理 机构 南京知识律师事务所 32 207 专利代理师 张苏沛 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/284(2020.01) G06K 9/62(2022.01) G06N 3/08(2006.01) (54)发明名称 基于少样本学习的网络安全协同处置的语 义分析方法 (57)摘要 本发明公开了一种基于少样本学习的网络 安全协同处置的语义分析方法, 包括步骤: 将运 营人员针对网络安全事件的应对过程作为语料 库; 将语料库划分为支持集和目标集, 抽取支持 文本和目标文本, 进行文本嵌入和位置嵌入处 理, 得到由标记向量和位置向量拼接的词向量; 将词向量输入多级注意力文本编码器, 调整词向 量的注意力权重; 将支持文本中的词向量输入动 态记忆模块, 根据每次被送入动态记忆模块的词 向量与语义向量的相似度动态调整语义向量; 将 支持文本和目标文本的词向量输入目标引入模 块, 找出目标文本中的关键词; 找出操作集中和 目标文本中的关键词对应的处理网络安全事件 的操作, 并向运营 人员做出操作推荐。 权利要求书3页 说明书9页 附图1页 CN 115329776 A 2022.11.11 CN 115329776 A 1.一种基于少样本学习的网络安全协同处置的语义分析方法, 其特征在于, 包括以下 步骤: S1: 记录网络安全协同处置的运营过程, 将运营人员针对网络安全事件的应对过程作 为语料库; S2: 将语料库划分为支持集和目标集, 从支持集中抽取支持文本, 从目标集中抽取目标 文本, 对抽取 的支持文本和目标文本进行文本嵌入和 位置嵌入处理, 得到由标记向量和位 置向量拼接的词向量; S3: 将词向量输入多级注意力文本编码器, 多级注意力文本编码器的注意力机制关注 对话中的角色信息, 结合上 下文, 调整词向量的注意力权 重; S4: 将支持文本中的词向量输入动态记忆模块, 动态记忆模块存放 个语义向量, 用于 表示不同语义簇的质心, 根据每次被送入动态记忆模块的词向量与语义向量的相似度动态 调整 个语义向量; S5: 将支持文本和目标文本的词向量输入目标引入模块, 将支持文本中代表关键词的 词向量与目标文本中的词向量进行一 一比对, 找出目标文本中的关键词; S6: 将关键词到对应处理网络安全事件的操作的映射集合放入操作集中, 其中关键词 到操作的映射集合由数据 统计得到, 根据目标文本中提取 的关键词, 找出操作集中和目标 文本中提取的关键词对应的处 理网络安全 事件的操作, 并向运营 人员做出操作推荐。 2.根据权利要求1所述的方法, 其特征在于, 步骤S1中, 网络安全协同处置的运营过程 包括: 建表序列化运营对话、 标记出运营人员的角色、 分析网络安全异常问题的关键词、 根 据分析安排对应的任务, 以上运营人员针对网络安全事件的应对过程构成网络安全协同处 置的语料库。 3.根据权利要求1所述的方法, 其特 征在于, 步骤S2还 包括: 对于输入的文本P是由n个对话文本和关键词标签的样本对 组成, 表达式为: 其中 表示文本中的第i段对话, 表示第i段对话对应的关键词标签; 在文本开头标记star t, 对话和关键词标签之间用 “$”隔开, 文本末尾标记end; 输入文本P通过词向量矩阵生成标记向量 , 为每个词分配的位置向量为 , 为对话中的角色分配的角色向量为 , 拼接标记向量和位置向量得到词向量, 表达式 为: 将三个初始化矩阵 和输入的词向量 相乘, 得到 , 其分别对应查 询词向量、 键词向量和值词向量, 表达式为: 。 4.根据权利要求3所述的方法, 其特 征在于, 步骤S3还 包括步骤: 将初始化矩阵 和输入的角色向量 相乘, 得到 对应的角色向量, 将角色向量权 利 要 求 书 1/3 页 2 CN 115329776 A 2加入注意力机制公式 中, 根据角色信息为文本分配权 重: 其中, 表示角色向量 的权重; 将词向量和角色向量送入多级注意力模块, 多级注意力模块由多个注意力头组成, 每 个注意力头 关注不同的文本信息, 多级注意力模块根据当前词和其他词之 间的相似度调整 注意力权 重, 计算当前词和其 他词的相似度, 表达式为: 对于计算出的相似度除以同一个系数 , 即对查询向量和键值向量的乘积进行缩 小, 然后用softmax函数做归一化处理, 采用注意力机制公式计算相似度, 注意力机制公式 的表达式为: 其中, 是为矩阵上三角部分赋值 为0的函数, 为K的维度大小; 将输出结果输入多级注意力文本编码器的归一化层, 对输出结果进行归一化处理 , 将数据映射到[0,1]之间, 表达式为: 其中, 表示经过多级注意力处 理的词向量; 将归一化处理的输出结果输入多级注意力文本编码器的前向传播层, 进行前向传播处 理 , 表达式为: 其中, 表示经过前向传播处理的词向量, 为激活函数, 为函数权重, 为函数偏置; 将前向传播处理 的输出结果和归一化处理 的输出结果做残差操作并进行归一化处理, 表达式为: 其中, 表示经过归一化处理的词向量; 通过叠加12层多级注意力文本编码器增加网络的容量、 增强网络的表达能力, 将经过 残差操作并进行归一 化处理的输出 结果输入12层多 级注意力文本编码器中, 表达式为: 其中, 表示第 i 层的多级注意力文本编码器 处理过的词向量, 代表多级注意力文本编码器, i表示第i层多 级注意力文本编码器。权 利 要 求 书 2/3 页 3 CN 115329776 A 3

PDF文档 专利 基于少样本学习的网络安全协同处置的语义分析方法

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于少样本学习的网络安全协同处置的语义分析方法 第 1 页 专利 基于少样本学习的网络安全协同处置的语义分析方法 第 2 页 专利 基于少样本学习的网络安全协同处置的语义分析方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-03-03 12:04:11上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。