金融行业标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111534103.2 (22)申请日 2021.12.15 (71)申请人 南昌大学 地址 330000 江西省南昌市红谷滩新区学 府大道999号 (72)发明人 朱自伟 张益宁 周梦垚 谢青  徐松龄 翟嘉璐 王梦宇  (74)专利代理 机构 北京众合诚成知识产权代理 有限公司 1 1246 代理人 王焕巧 (51)Int.Cl. G06F 16/2458(2019.01) G06F 16/215(2019.01) G06K 9/62(2022.01) G06N 3/00(2006.01)G06N 20/10(2019.01) G06Q 50/06(2012.01) (54)发明名称 一种变压器DGA在线监测数据的处 理方法 (57)摘要 本发明提出一种变压器DGA在 线监测数据的 处理方法, 根据传回数据的特征, 将在线数据等 效为时间序列; 第一阶段引入滑动窗口算法的思 想, 提出一种改进的序列分段线性化算法, 将序 列数据划分为若干由斜率与跨度表征的线段, 再 使用基于改进的K ‑means聚类将在线 监测数据符 号化, 最后使用APRI ORI算法挖掘DGA中不同指标 之间的关联性, 并以此发掘其中存在的异常数 值; 第二阶段, 根据筛除的异常数值采样点, 使用 改进的粒子群优化的支持向量回归算法, 保障算 法的求解速度与求解多样性, 优化支持向量回归 算法中的关键参数对这些采样点进行修复, 以此 完成变压器在线DGA监测数据的处 理。 权利要求书4页 说明书10页 附图5页 CN 114372093 A 2022.04.19 CN 114372093 A 1.一种变压器DGA在线监测数据的处 理方法, 其特 征在于: 包括如下步骤: S1、 数据集的滑动窗口处理: 引 入滑动窗口的思想, 使用长度为L的窗口截取在线数据 集; S2、 以一定的步长滑动窗口遍历在线数据集: 设置滑动步长为l, 拖动窗口在整体数据 集上滑动, 直至遍历所有数据; 令在线数据集长度为L1, 遍历之后得到 个数据窗 口, 导出所有窗口中的数据, 构成待分析 数据集DSi, i∈n; S3、 序列数据的分段线性化: 提出序列数据的分段线性化算法, 将在线数据中不定量的 点组合在一起, 形成多组数据点集; 数据点的分组的标准在于其中所有点拟合出 的线段与 实际数据点之间的误差小于阈值, 且使用的线段的斜 率与线段跨度表征拟合出的线段; S4、 构建描述不同线段相似度的模型: 基于线段的斜率与跨度构建相似度模型, 并使用 基于最大最小距离改进的K ‑means聚类算法为线 段划分类别, 并为同类别线 段赋予符号, 完 成序列数据的符号 化; S5、 挖掘不同序列之间 的关联性: 基于Apriori算法的思想, 设置最小置信度与支 持度, 挖掘不同序列之间存在的频繁项集, 量 化不同序列之间的关联性; S6、 提取筛 除DGA在线监测数据中存在的异常值: 根据序列之间的关联性强弱, 对判定 数据中存在的异常数值类型, 分离出不同异常模式的数据; S7、 改进粒子群优化支持向量 回归: 定义粒子解集之间的距离, 基于该距离划分不同粒 子类别, 并定义粒子更新方式; 使用算法优化支持向量回归的关键参数, 完成DGA在线数据 的处理。 2.根据权利要求1所述的一种变压器DGA在线监测数据的处理方法, 其特征在于: S3中 提出的序列数据的分段线性 化算法的具体步骤是: 1)对于类似DGA的设备指标在线监测数据, 等效为时间序列数据; 2)对时间序列 XK={x1,x2,…,xk}, 以长度为L(L<k)的窗口截取数据点, 对截取窗口内 的数据, 基于滑动窗口 的思想, 对其中含有的数据点进行分段线性拟合; 3)以窗口内的首个 数据点为初始线段的拟合起点, 令 该点为xi, 假设初始线段的拟合终 点为xi+m(m>1), 将这m+1个数据点拟合 为一条线段; 4)那么对于这样一条线段, 用如下 所示的式子表达: my‑(Xi+m‑1‑Xi)X‑(m‑1)Xi+Xi+m‑1=0             (2) 以实际数据点至拟合线段的距离作为拟合误差; 计算拟合线段步长 内所有实际数据点 至线段的距离, 以其之和作为该线段的拟合整体误差 ER: 5)设置拟 合误差阈值为ERr, 如果ER<ERr, 则说明该线段仍然可以继续增加拟 合点, 令m权 利 要 求 书 1/4 页 2 CN 114372093 A 2=m+1, 并重复上述步骤; 如果有ER>ERr, 则判定该线段无法拟合, 保存当前线段的拟合终 点为Xend=Xi+m‑1, 记录其数据采样时刻, 之后回到步骤3), 重置参数m, 并以当前拟合终点作 为下一线段的拟合起点进行下一部分的数据拟合, 直至该序列中所有的数据点都拟合完 毕。 3.根据权利要求1所述的一种变压器DGA在线监测数据的处理方法, 其特征在于: S4中 构建相似度模型, 并基于此模型进行聚类分析的主 要步骤是: 1)对同一序列中存在的所有 线段属性进行 形如 的标准化操作; 2)在聚类分析时, 建立衡量线段相似度的标准; 提取线段的斜率与跨度两个关键参数, 使用欧式距离描述线段之 间的相似度, 在其中以权重的方式表示对线段不同属性的考虑程 度; 建立的线段相似度模型如下式所示: 3)基于上述的线段相似度模型, 对线段集合使用基于最大最小距离改进的K ‑means算 法进行聚类分析, 将相似的线段划分为同一类别。 4.根据权利要求3所述的一种变压器DGA在线监测数据的处理方法, 其特征在于: S4中 基于最大最小距离改进的K ‑means算法, 其主 要步骤是: 1)最大最小距离同样以欧式距离为基础, 其与K ‑means算法不同之处在于其取尽量远 的对象作为聚类中心; 对于样本集, 给定一比例系数θ(0<θ<1), 任取样本集sn中的任一样 本为初始聚类中心, 记为z1; 2)任取剩下n ‑1个样本中距离 z1最远的样本为第二个聚类中心, 记为z2; 3)计算剩下n ‑2个样本与z1与z2的距离, 并求出其中最小值, 即: Dij=||xi‑zj||,j=1,2            (6) Di=min(Di1,Di2),i=1,2,…,n            (7) 4)若 Di=max{Di}>θ×||zi‑z2||             (8) 则选取对应样本si作为第三个聚类中心z3; 5)假设有K个聚类中心, 以此计算剩下的n ‑K个样本至聚类中心的距离, 并有: Dr=max{mi n(Di1,Di2,…Dik)}>θ×||z1‑z2||          (9) 则对应的样本xr为第K+1个 聚类中心, 记为zK+1; 并不断循环这个过程, 直至没有新的聚 类中心出现; 6)当没有新的聚类中心出现时, 将 样本按最小距离原则分配至各类中。 5.根据权利要求1所述的一种变压器DGA在线监测数据的处理方法, 其特征在于: S5中 序列关联性挖掘的主 要过程为: 1)最小支持度与最小置信度参数的设置; 置信度与支持度阈值是判定序列关联与 频繁 项集的基础, 记频繁 ‑1与频繁‑2项集的最小支持度度阈值为minsup1与minsup2, 序列关联挖 掘中的最小置信度阈值 为mincon; 2)频繁项集的生成; 使用经过归总之后的两符号化序列作为事务集, 记为权 利 要 求 书 2/4 页 3 CN 114372093 A 3

.PDF文档 专利 一种变压器DGA在线监测数据的处理方法

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种变压器DGA在线监测数据的处理方法 第 1 页 专利 一种变压器DGA在线监测数据的处理方法 第 2 页 专利 一种变压器DGA在线监测数据的处理方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 02:05:58上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。