金融行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211094825.5 (22)申请日 2022.09.05 (71)申请人 西安电子科技大 学 地址 710071 陕西省西安市太白南路2号 申请人 中国航发四川燃气涡轮 研究院 (72)发明人 刘若辰 张锦伟 张有 王晗丁  (74)专利代理 机构 陕西电子 工业专利中心 61205 专利代理师 王品华 (51)Int.Cl. G06K 9/62(2022.01) G06F 30/20(2020.01) (54)发明名称 基于自适应在线学习的密度数据流聚类方 法 (57)摘要 本发明公开了一种基于自适应在线学习的 数据流聚类方法, 主要解决现有技术因固定参数 及模型对参数的依赖性所导致聚类结果精度低 的问题。 其实现方案是: 根据数据流中数据信息 创建微簇; 微簇接收到一个新的数据点后使用半 径的自适应增长策略使活跃的微簇吸收更多的 数据学习微簇结构, 并通过不同类型微簇的能量 更新策略处理数据流不断演化, 使微簇能量衰减 模拟演化过程, 微簇消亡引起聚类改变; 根据改 变的微簇间距离, 实现同类数据的聚合, 输出数 据聚类结果。 本发明通过自适应调整策略对微簇 模型的参数动态调优, 在线学习数据更新微簇模 型, 提高了动态数据环境下数据流聚类的精度, 可用于互联网数据的模型学习、 网络入侵检测、 网络点击流及天气监测。 权利要求书2页 说明书8页 附图2页 CN 115496133 A 2022.12.20 CN 115496133 A 1.一种基于自适应在线学习的数据流聚类方法, 其特 征在于, 包括如下步骤: (1)接收动态数据环境下的数据流, 并将数据流中的数据按照 接收顺序, 以1000个数据 点作为一个间隔, 将数据流划分为 n个数据块, n≥3; (2)根据数据块中的第一个数据点信息单独创建一个微簇结构, 并将该微簇加入到起 始为空的微簇列表中; (3)计算数据块中其他数据点Xi逐个与微簇列表中的微簇中心 C的欧式距离d, 并将数据 点映射到欧式距离最小的微簇, 判断当前 数据点是否加入到微簇中: 若欧式距离小于被映射的微簇的最小半径R, 即d<R时, 且该微簇是缓冲区中的弱微簇, 此时微簇被激活成核心 微簇, 则将该微簇的能量变更为 1, 再将当前数据点加入到被映射的 微簇, 执行步骤(4); 否则, 由当前数据点单独创建一个新的微簇结构, 并加入到现有的微簇列表中, 执行步 骤(5); (4)微簇列表中的微簇 接收到一个新的数据点后, 进行 更新操作: (4a)当数据点Xi加入后, 对微簇的半径Rt进行自适应更新, 得到更新后的微簇半径最新 值Rt+1: 其中, Nt+1=Nt+1为微簇的局部密度阈值, N ′t为微簇的空间信息计数值, Decay为微簇的 衰减因子, 的比值为自适应调整因子, Rmax为微簇最大半径; (4b)当数据点Xi位于壳区域, 即数据点在微簇中心位置[0.5*Rt+1,Rt+1]范围构成的空间 区域时, 对微簇中心Ct进行自适应更新, 得到更新后的中心最 新值Ct+1: 其中, N′t+1=N′t+1为微簇的空间信息计数值; (4c)对微簇的能量Et进行自适应更新, 得到更新后的能量 最新值Et+1: 执行步骤(5); (5)对微簇列表中的微簇能量E ′t进行衰减, 得到 衰减后的能量 最新值E′t+1: 执行步骤(6); (6)根据衰减后的微簇能量 值与0的大小关系, 判断当前时刻微簇是否发生变化: 如果微簇衰减后的能量值小于0, 则该微簇发生变化, 并根据微簇的类型进行相应的变 化: 若微簇是局部密度阈值Nt大于密度阈值Nth的核心微簇, 将其变成缓冲区中弱微簇, 对弱 微簇的结构进行相应的变化; 否则, 微簇是缓冲区中的弱微簇, 将其 直接删除; 如果微簇衰减后的能量 值大于等于 0时, 则微簇不发生变化, 执 行步骤(7); (7)计算当前微簇与微簇列表中所有微簇的相交距离d ′, 将微簇中心的欧式距离d小于 相交距离d ′的微簇加入到各自的边缘列表EL中, 即将属于相交的微簇划分为同一类, 实现权 利 要 求 书 1/2 页 2 CN 115496133 A 2对宏观集群的更新; (8)将更新宏观集群后属于同一类的结果在线输出, 完成对数据流的聚类。 2.根据权利要求书1所述的方法, 其特征在于, 所述步骤(2)中微簇结构包括中心C、 半 径R、 能量E、 局部密度阈值N、 空 间信息计数N ′和边缘列表E L, 其中, C =Xi, Xi为当前数据点, E =1, R=Rmin, Rmin为用户输入的最小半径, N =1, N′=1, EL初始化 为空集 3.根据权利要求书1所述的方法, 其特征在于, 所述步骤(6)中对弱微簇的结构进行相 应的变化, 是先将弱微簇的能量变为0.5, 再将弱微簇边缘列表中的微簇找出, 然后将微簇 与弱微簇的信息记录清除, 最后将弱微簇的边 缘列表置成空集 4.据权利要求书1所述的方法, 其特征在于, 所述步骤(7)中计算当前微簇与微簇列表 中所有微簇的相交距离d ′, 公式如下: 其中, R是当前微簇的半径, R ′是微簇列表中微簇的半径。权 利 要 求 书 2/2 页 3 CN 115496133 A 3

.PDF文档 专利 基于自适应在线学习的密度数据流聚类方法

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于自适应在线学习的密度数据流聚类方法 第 1 页 专利 基于自适应在线学习的密度数据流聚类方法 第 2 页 专利 基于自适应在线学习的密度数据流聚类方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 01:01:18上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。