基于改进的k-medoids聚类算法的台区线损异常识别方法与流程

未命名 09-16 阅读:70 评论:0


1.本发明涉及一种基于改进的k-medoids聚类算法的台区线损异常识别方法。


背景技术:

2.线路线损会导致电力损耗,不利于电网健康发展,为线损对电网运营造成的负面影响,因此为保证线路台区稳定运行,精准有效地划分台区线损数据,清晰划分台区线损数据类别,需要一种台区线损异常识别方案。


技术实现要素:

3.有鉴于此,本发明的目的在于提供一种基于改进的k-medoids聚类算法的台区线损异常识别方法,旨在解决上述问题。
4.为实现上述目的,本发明采用如下技术方案:
5.一种基于改进的k-medoids聚类算法的台区线损异常识别方法,包括以下步骤:
6.步骤s1:获取台区的线损数据,并预处理;
7.步骤s2:基于预处理后的台区的线损数据,通过k-medoids聚类算法进行聚类分析,每个台区得到两个变量,一个是聚类中心点,另一个是欧氏距离;
8.步骤s3:基于聚类中心点初步判断台区是否异常,若正常,则通过判断欧氏距离是否大于阈值进一步判断台区是否异常。
9.进一步的,所述预处理包括通过拉格朗日插值算法对缺失数据进行补充和去除异常值。
10.进一步的,所述拉格朗日插值算法,具体为:
11.(1):求已知n+1个点对的拉格朗日基本多项式lj(x),其表达式为:
[0012][0013]
拉格朗日基本多项式lj(x)的特点是在xj上取值为1,在其他的点xi上取值为0;
[0014]
(2):求已知n+1个点对的拉格朗日差值多项式l
x
,其表达式为:
[0015][0016]
(3):将缺失的函数值对应的点代入插值多项式得到缺失值的近似值l
x
,完成缺失数据的填补任务。
[0017]
进一步的,所述步骤s2具体为:
[0018]
(1)设置初始簇中心oi时,需要有n个数据对象组成数据集,将这些数据集分为k个聚类,在k聚类中随意选择不同的数据对象;
[0019]
(2)重复迭代;
[0020]
(3)根据式(1)计算获取的数据对象到oi的距离,进行分配
[0021][0022]
式中:x=(x1,x2,

,x
p
)与y=(y1,y2,

,y
p
)分别为数据集中两个p维的数据对象;
[0023]
(4)根据式(2)计算得出聚类成本ei;
[0024][0025]
式中:k为聚类数量;|x
j-oi|2与oi分别为欧氏距离与簇类ci的中心点;
[0026]
(5)为了计算数据对象o
tmp
的消耗代价e
tmp
,需要顺序采集非簇中心点的数据对象o
tmp
,并在各簇中完成;
[0027]
(6)若e
tmp
《ei,则说明聚类还在收敛,用o
tmp
替换oi,不断迭代聚类,产生k个新簇;
[0028]
(7)直到e值保持稳定。
[0029]
进一步的,所述通过判断欧氏距离是否大于阈值进一步判断台区是否异常,具体为:将欧氏距离的结果除以台区日线损率数据的总个数,欧氏距离大于阈值则说明台区日线损率波动较大,判定台区线损存在异常需要进行治理,欧式距离在阈值以内则说明台区日线损率稳定。
[0030]
本发明与现有技术相比具有以下有益效果:
[0031]
本发明保证线路台区稳定运行,实现精准有效地划分台区线损数据,清晰划分台区线损数据类别。
附图说明
[0032]
图1是本发明方法流程图。
具体实施方式
[0033]
下面结合附图及实施例对本发明做进一步说明。
[0034]
请参照图1,本发明提供一种基于改进的k-medoids聚类算法的台区线损异常识别方法,包括以下步骤:
[0035]
步骤s1:获取台区的线损数据,并预处理;
[0036]
步骤s2:基于预处理后的台区的线损数据,通过k-medoids聚类算法进行聚类分析,每个台区得到两个变量,一个是聚类中心点,另一个是欧氏距离;
[0037]
步骤s3:基于聚类中心点初步判断台区是否异常,若正常,则通过判断欧氏距离是否大于阈值进一步判断台区是否异常。
[0038]
在本实施例中,预处理包括通过拉格朗日插值算法对缺失数据进行补充和去除异常值。
[0039]
优选的,拉格朗日插值算法,具体为:
[0040]
(1):求已知n+1个点对的拉格朗日基本多项式lj(x),其表达式为:
[0041]
[0042]
拉格朗日基本多项式lj(x)的特点是在xj上取值为1,在其他的点xi上取值为0;
[0043]
(2):求已知n+1个点对的拉格朗日差值多项式l
x
,其表达式为:
[0044][0045]
(4):将缺失的函数值对应的点代入插值多项式得到缺失值的近似值l
x
,完成缺失数据的填补任务。
[0046]
优选的,在本实施例中,k-medoids聚类算法模型通过对缺失的原始的数据通过拉格朗日插值算法进行补充,最后输出台区线损数据集x,其由n个线损数据对象组成,待划分的聚类数为k;输出:k个聚类簇ci,确保聚类准则函数e值最小化。
[0047]
k-medoids聚类算法利用欧式距离权衡类内相似性,用下式描述该距离d
(x,y)
:
[0048][0049]
式中:x=(x1,x2,

,x
p
)与y=(y1,y2,

,y
p
)分别为数据集中两个p维的数据对象。
[0050]
通过目标函(误差平方和准则函数)e评价k-medoids聚类的划分聚类效果,则有:
[0051][0052]
式中:k为聚类数量;|x
j-oi|2与oi分别为欧氏距离与簇类ci的中心点,e为数据对象与其所在簇类的中心点误差平方和。
[0053]
优选的,在本实施例中,步骤s2具体为:
[0054]
(1)设置初始簇中心oi时,需要有n个数据对象组成数据集,将这些数据集分为k个聚类,在k聚类中随意选择不同的数据对象;
[0055]
(2)重复迭代;
[0056]
(3)根据式(1)计算获取的数据对象到oi的距离,进行分配
[0057]
(4)根据式(2)计算得出聚类成本ei;
[0058]
(5)为了计算数据对象o
tmp
的消耗代价e
tmp
,需要顺序采集非簇中心点的数据对象o
tmp
,并在各簇中完成;
[0059]
(6)若e
tmp
《ei,则说明聚类还在收敛,用o
tmp
替换oi,不断迭代聚类,产生k个新簇;
[0060]
(7)直到e值保持稳定。
[0061]
在本实施例中,通过判断欧氏距离是否大于阈值进一步判断台区是否异常,具体为:将欧氏距离的结果除以台区日线损率数据的总个数,欧氏距离大于阈值则说明台区日线损率波动较大,判定台区线损存在异常需要进行治理,欧式距离在阈值以内则说明台区日线损率稳定,,在聚类中心点合格的基础上可以判定台区线损正常。
[0062]
以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。

技术特征:
1.一种基于改进的k-medoids聚类算法的台区线损异常识别方法,其特征在于,包括以下步骤:步骤s1:获取台区的线损数据,并预处理;步骤s2:基于预处理后的台区的线损数据,通过k-medoids聚类算法进行聚类分析,每个台区得到两个变量,一个是聚类中心点,另一个是欧氏距离;步骤s3:基于聚类中心点初步判断台区是否异常,若正常,则通过判断欧氏距离是否大于阈值进一步判断台区是否异常。2.根据权利要求1所述的基于改进的k-medoids聚类算法的台区线损异常识别方法,其特征在于,所述预处理包括通过拉格朗日插值算法对缺失数据进行补充和去除异常值。3.根据权利要求2所述的基于改进的k-medoids聚类算法的台区线损异常识别方法,其特征在于,所述拉格朗日插值算法,具体为:(1):求已知n+1个点对的拉格朗日基本多项式l
j
(x),其表达式为:拉格朗日基本多项式l
j
(x)的特点是在x
j
上取值为1,在其他的点x
i
上取值为0;(2):求已知n+1个点对的拉格朗日差值多项式l
x
,其表达式为:(3):将缺失的函数值对应的点代入插值多项式得到缺失值的近似值l
x
,完成缺失数据的填补任务。4.根据权利要求1所述的基于改进的k-medoids聚类算法的台区线损异常识别方法,其特征在于,所述步骤s2具体为:(1)设置初始簇中心o
i
时,需要有n个数据对象组成数据集,将这些数据集分为k个聚类,在k聚类中随意选择不同的数据对象;(2)重复迭代;(3)根据式(1)计算获取的数据对象到o
i
的距离,进行分配式中:x=(x1,x2,

,x
p
)与y=(y1,y2,...,y
p
)分别为数据集中两个p维的数据对象;(4)根据式(2)计算得出聚类成本e
i
;式中:k为聚类数量;|x
j-o
i
|2与o
i
分别为欧氏距离与簇类c
i
的中心点;(5)为了计算数据对象o
tmp
的消耗代价e
tmp
,需要顺序采集非簇中心点的数据对象o
tmp
,并在各簇中完成;(6)若e
tmp
<e
i
,则说明聚类还在收敛,用o
tmp
替换o
i
,不断迭代聚类,产生k个新簇;
(7)直到e值保持稳定。5.根据权利要求1所述的基于改进的k-medoids聚类算法的台区线损异常识别方法,其特征在于,所述通过判断欧氏距离是否大于阈值进一步判断台区是否异常,具体为:将欧氏距离的结果除以台区日线损率数据的总个数,欧氏距离大于阈值则说明台区日线损率波动较大,判定台区线损存在异常需要进行治理,欧式距离在阈值以内则说明台区日线损率稳定。

技术总结
本发明涉及一种基于改进的k-medoids聚类算法的台区线损异常识别方法,包括以下步骤:步骤S1:获取台区的线损数据,并预处理;步骤S2:基于预处理后的台区的线损数据,通过k-medoids聚类算法进行聚类分析,每个台区得到两个变量,一个是聚类中心点,另一个是欧氏距离;步骤S3:基于聚类中心点初步判断台区是否异常,若正常,则通过判断欧氏距离是否大于阈值进一步判断台区是否异常。本发明可以保证线路台区稳定运行,实现精准有效地划分台区线损数据,清晰划分台区线损数据类别。清晰划分台区线损数据类别。清晰划分台区线损数据类别。


技术研发人员:李荣台 林远兴 陈凯 游化斌 林晨 陈振江 周友琪 游宗明 曾舒娴 张超武 朱华 蓝龑 赖华程 王美青
受保护的技术使用者:国网福建省电力有限公司 国网福建省电力有限公司龙岩供电公司
技术研发日:2023.04.18
技术公布日:2023/9/14
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐