金融行业标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111532876.7 (22)申请日 2021.12.15 (71)申请人 南京南瑞信息通信科技有限公司 地址 210003 江苏省南京市 鼓楼区南瑞路8 号 (72)发明人 施健 胡游君 邱玉祥 刘军  蔡世龙 魏训虎 潘安顺 富思  樊泽宇 陈克朋 周忠冉 张文鹏  李马峰 刘皓 邱文元 顾亚林  张俊杰 李洋 沈耀威  (74)专利代理 机构 南京纵横知识产权代理有限 公司 32224 代理人 董建林 (51)Int.Cl. G06K 9/62(2022.01)G06Q 50/06(2012.01) (54)发明名称 一种台区用户关系识别方法、 装置及 存储介 质 (57)摘要 本发明公开了一种台区用户关系识别方法、 装置及存储介质, 其方法包括周期性采集台区下 所有用户的电压数据, 并构建所有用户的电压数 据向量集合; 对 所述所有用户的电压数据向量集 合基于主成分分析法PCA进行降维处理; 对降维 后的所有用户的电压数据向量集合进行DBSCAN 密度聚类, 得到多个簇划分; 基于簇划分识别用 户关系, 每个簇划分中的电压数据对应的用户属 于同一台区; 本发明具有识别精度高、 适应性好 的特点。 权利要求书3页 说明书6页 附图1页 CN 114266296 A 2022.04.01 CN 114266296 A 1.一种台区用户关系识别方法, 其特 征在于, 包括: 周期性采集台区下 所有用户的电压数据, 并构建所有用户的电压数据向量 集合; 对所述所有用户的电压数据向量 集合基于主成分 分析法PCA进行降维处 理; 对降维后的所有用户的电压数据向量 集合进行DBSCAN密度聚类, 得到多个簇划分; 基于簇划分识别用户关系, 每 个簇划分中的电压数据对应的用户属于同一台区。 2.根据权利要求1所述的一种台区用户关系识别方法, 其特征在于, 所述电压数据为台 区变压器低压侧电压数据。 3.根据权利要求1所述的一种台区用户关系识别方法, 其特征在于, 所述所有用户的电 压数据向量 集合Un×m(u)为: Un×m(u)={u1, u2,…, ui,…, um}, (i=1,…, m) ui={u1, i, u2, i,…, uj, i,…, un, i}, (j=1, …, n) 其中, n为采 集周期的时段数量, m为台区中用户数量; ui为第i个用户的电压 数据向量集 合, uj, i为第i个用户第j个时段内的电压数据。 4.根据权利要求3所述的一种台区用户关系识别方法, 其特征在于, 所述对所述所有用 户的电压数据向量 集合基于主成分 分析法PCA进行降维处 理包括: 对电压数据向量集合Un×m(u)中的电压数据uj, i进行去中心化处理, 得到去中心化处理 后的电压数据 根据电压数据 生成电压数据向量集合 并基于电压数据向量集合 生成电压向 量集合 根据电压向量 集合 计算协方差矩阵Cov: 计算协方差矩阵Cov的特征值及对应的特征向量, 将特征向量按照特征值的大小从大 到小进行排列; 取前l个特征向量并进行 标准化处理, 生成标准 化处理的特征矩阵Sl×m; 根据特征矩阵Sl×m与电压向量 集合 计算降维后的电压向量 集合Ul×m(u): 5.根据权利要求4所述的一种台区用户关系识别方法, 其特征在于, 所述对降维后的所 有用户的电压数据向量 集合进行DBSCAN密度聚类, 得到多个簇划分包括: 基于降维后的所有用户的电压数据向量 集合Ul×m(u)计算电压数据 ε ‑领域 其中, 和 分别为电压数据向量 集合Ul×m(u)中第i个和第j个用户的电压数据向量 集 合, ε为距离阈值, 为电压数据向量 集合 和电压数据向量 集合 的距离;权 利 要 求 书 1/3 页 2 CN 114266296 A 2取 对应电压数据向量集合 并按照 的大小顺序加入 核心对象集 合Ω中; 其中, Mi nPts为样本阈值; 从核心对象集合Ω中按照从大到小的顺序选 取核心对象 找出所述核心对象 的ε‑ 领域 中所有直接密度可达对象, 生成簇划分C, 并将所述核心对象 从核心对象集 合Ω中剔除, 重复执 行当前步骤直至核心对象集 合Ω为空。 6.根据权利要求5所述的一种台区用户关系识别方法, 其特征在于, 所述距离阈值ε和 样本阈值Mi nPts的获取包括: 初始化k个聚类簇 Cj以及相应的质心 μj; 将电压向量集合Ul×m(u)中每个用户向量纳入与其距离最小的质心 所对应的聚类簇中; 所述距离最小为: 重新计算 k个聚类簇的质心 通过重新计算的质心 带入上述步骤替换初始化的质心 μj并迭代运算直至收敛, 得到 最终的k个聚类簇 计算每个聚类簇 中所有用户向量与质心的距离平均值, 并以质心为中心, 以距离平 均值为半径画圆; 在圆中取用户数量最大的一条直径并确定用户数量, 通过直径长度除以用户数量得到 切割距离; 取切割距离的0.4 ‑3倍设置为距离阈值ε, 取距离阈值ε内的用户数量设置为样本阈值 MinPts。 7.一种台区用户关系识别装置, 其特 征在于, 所述装置包括: 采集模块, 用于周期性采集台区下所有用户的 电压数据, 并构建所有用户的 电压数据 向量集合; 降维模块, 用于对所述所有用户的电压数据向量集合基于主成分分析法PCA进行降维 处理; 聚类模块, 用于对降维后的所有用户的电压数据向量集合进行DBSCAN密度 聚类, 得到 多个簇划分; 识别模块, 用于基于簇划分识别用户关系, 每个簇划分中的 电压数据对应的用户 属于 同一台区。 8.一种台区用户关系识别装置, 其特 征在于, 包括处 理器及存 储介质; 所述存储介质用于存 储指令; 所述处理器用于根据 所述指令进行操作以执行根据权利要求1 ‑6任一项所述方法的步 骤。权 利 要 求 书 2/3 页 3 CN 114266296 A 3

.PDF文档 专利 一种台区用户关系识别方法、装置及存储介质

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种台区用户关系识别方法、装置及存储介质 第 1 页 专利 一种台区用户关系识别方法、装置及存储介质 第 2 页 专利 一种台区用户关系识别方法、装置及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-19 02:06:05上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。