一种基于波动互相关分析的配网电压异常数据填补方法与流程
未命名
08-15
阅读:75
评论:0

1.本发明涉及一种基于波动互相关分析的配网电压异常数据填补方法fsmdfcca(filling strategy for abnormal data based on fluctuation cross-correlation analysis),属于电力系统电压辨识技术领域。
背景技术:
2.随着电网的不断发展,数据的准确性和完整性对配网电压控制尤为重要,但随着采集数据量成指数级的增长,因人工录入、采集装置故障导致的电压数据缺失问题时有发生,因此需要对缺失数据进行辨识或补全,传统算法都提供了一些解决思路,但是由于较少利用相似属性作为分析依据,填补效果并不理想。近年来,随着波动互相关理论的提出,以及传统机器学习的随机森林等方法的逐步成熟,通过相似集合来训练随机森林成为可能,为此我们提出了一种基于波动互相关分析的配网电压异常数据填补方法,进一步提高配网电压缺失值的填补精度,满足电网发展需求。
技术实现要素:
3.本发明针对现有技术中的不足,提供一种基于波动互相关分析的配网电压异常数据填补方法,以提高填补数据的精度,为配网调控提供支撑。
4.为实现上述目的,本发明采用以下技术方案:
5.一种基于波动互相关分析的配网电压异常数据填补方法,包括如下步骤:
6.s1、获取电网的历史数据;
7.s2、将历史数据划分为训练集和测试集;
8.s3、基于属性加权策略构建相似集合wz;
9.s4、通过n-bootstrap抽样方法构建随机森林;
10.s5、采用相似集合wz对随机森林进行训练,并通过测试集对训练后的随机森林模型进行测试;
11.s6、判断训练后的随机森林模型是否满足测试要求,如果训练后的随机森林模型满足测试要求,转入步骤s7,否则转入步骤s5继续训练;
12.s7、采用训练完成的随机森林模型对电压异常值进行预测,预测结果作为填补结果;
13.s8、结束本次填补。
14.为优化上述技术方案,采取的具体措施还包括:
15.进一步地,步骤s3具体包括:
16.s31、获取电压关联属性集合sxi,i=1,2,
……
,u,其中,u表示关联属性的个数;
17.s32、采用波动互相关系数分析关联属性间的互相相关情况,设定阀值δ,计算关联属性间的波动互相关系数,当波动互相关系数值大于阀值δ时,将该关联属性存入属性集合wg;
18.s33、将属性集合wg中的关联属性采用熵权法获得各关联属性的权重w,w=[w1,w2,...,wm],m表示属性集合wg中的关联属性的数量;
[0019]
s34、根据波动互相关系数得到关联属性综合加权值jq,jq=w1sx1+w2sx2+
…
+wmsxm;
[0020]
s35、从训练集中挑选各个典型时段的历史数据断面并计算对应的关联属性综合加权值jq,并将关联属性综合加权值jq从大到小进行排序,给定关联阈值β,若历史数据断面的关联属性综合加权值jq大于给定的阈值β,则将历史数据断面存入相似集合wz。
[0021]
进一步地,步骤s4具体包括:
[0022]
s41、对随机森林中的每一棵cart决策树,通过n-bootstrap抽样从初始样本集合s中抽取样本,并构建n个子集{s1,s2,...,sn},将n个子集合中一半的样本作为训练样本集s
ntr
,另一半样本作为测试样本集n
nte
;
[0023]
s42、从训练样本集s
ntr
中任选样本作为根节点进行训练,并构建多指标融合分裂系数rh(s
ntr
)作为节点是否分裂的衡量指标:
[0024][0025]
要求α∈{0,1},且α,不能相等,其中,gini()表示基尼系数,gain()表示信息增益;计算测试集合中最小的融合分裂系数值min{rh(s
ntr
)},作为节点分裂的判断标准进行分裂操作;节点分裂完成后形成决策树;
[0026]
s43、最后将生成的所有决策树构建随机森林。
[0027]
进一步地,步骤s32中,所述计算关联属性间的波动互相关系数具体为:
[0028]
s321、对于两个等长的时间序列xi和yi,其中i=1,2,
…
,m;计算xi、yi与平均值的差之和:
[0029][0030][0031]
其中:l表示采样长度,δx(l)、δy(l)分别表示xi和yi在采样长度l下与平均值的差之和,和分别表示xi和yi的平均值;
[0032]
s322、计算分别代表xi和yi自相关性的前向差分:
[0033]
δx(l,l0)=x(l0+l)-x(l0),l0=1,2,
…
,m-l
[0034]
δy(l,l0)=y(l0+l)-y(l0),l0=1,2,
…
,m-l
[0035]
其中:l=1,2,
…
,m-1,对于每一个取样时间段l都有l0=m-l个差值,δx(l,l0)和δy(l,l0)分别表示xi和yi的自相关性的前向差分;
[0036]
s323、计算xi和yi的协方差:
[0037][0038]
[0039][0040]
其中:cov
xy
(l)表示xi和yi的协方差,表示
·
的平均;
[0041]
s324、计算xi和yi的波动互相关系数,若xi和yi之间存在关联性,则cov
xy
(l)满足幂律分布其中,h
xy
为波动互相关系数,表示xi和yi相关程度;通过拟合幂律分布得到波动互相关系数h
xy
。
[0042]
进一步地,步骤s31中,所述关联属性包括有功功率、无功功率、电流、温度、湿度和临近点电压。
[0043]
进一步地,步骤s6中,所述判断训练后的随机森林模型是否满足测试要求采用的方法为计算预测值和真实值之间的均方根误差。
[0044]
本发明的有益效果是:
[0045]
本发明提出的一种基于波动互相关分析的配网电压异常数据填补方法,能够利用历史数据对电压填补模型进行训练,进而提高电压填补数据的准确性;本发明通过引入波动互相关分析算法构建和缺失属性相关的属性,并采用熵权法对强关联属性进行权重赋值,根据历史数据的综合属性排序结果得到相似集合,并用相似集合对改进随机森林模型进行训练,实现配网电压缺失值的精确填补。
附图说明
[0046]
图1为本发明提出的基于波动互相关分析的配网电压异常数据填补方法的流程图;
[0047]
图2为基于波动互相关的属性综合加权流程图;
[0048]
图3为不同算法填补结果均方根误差对比图;
[0049]
图4为不同算法填补结果准确度对比图;
[0050]
图5为fsmdfcca填补结果与真实值对比图。
具体实施方式
[0051]
现在结合附图对本发明作进一步详细的说明。
[0052]
在一实施例中,本发明提出了一种基于波动互相关分析的配网电压异常数据填补方法,该方法的流程图如图1所示,包括如下步骤:
[0053]
s1、获取电网的历史数据;
[0054]
s2、将历史数据划分为训练集和测试集;
[0055]
s3、基于属性加权策略构建相似集合wz;
[0056]
s4、通过n-bootstrap抽样方法构建随机森林;
[0057]
s5、采用相似集合wz对随机森林进行训练,并通过测试集对训练后的随机森林模型进行测试;
[0058]
s6、判断训练后的随机森林模型是否满足测试要求,如果训练后的随机森林模型满足测试要求,转入步骤s7,否则转入步骤s5继续训练;
[0059]
s7、采用训练完成的随机森林模型对电压异常值进行预测,预测结果作为填补结
果;
[0060]
s8、结束本次填补。
[0061]
步骤s3的具体流程如图2所示,包括:
[0062]
s31、获取电压关联属性集合sxi,i=1,2,
……
,u,其中,u表示关联属性的个数;所述关联属性包括有功功率、无功功率、电流、温度、湿度和临近点电压。
[0063]
s32、采用波动互相关系数分析关联属性间的互相相关情况,设定阀值δ,计算关联属性间的波动互相关系数,当波动互相关系数值大于阀值δ时,将该关联属性存入属性集合wg;
[0064]
s33、将属性集合wg中的关联属性采用熵权法获得各关联属性的权重w,w=[w1,w2,...,wm],m表示属性集合wg中的关联属性的数量;
[0065]
s34、根据波动互相关系数得到关联属性综合加权值jq,jq=w1sx1+w2sx2+
…
+wmsxm;
[0066]
s35、从训练集中挑选各个典型时段的历史数据断面并计算对应的关联属性综合加权值jq,并将关联属性综合加权值jq从大到小进行排序,给定关联阈值β,若历史数据断面的关联属性综合加权值jq大于给定的阈值β,则将历史数据断面存入相似集合wz。
[0067]
步骤s32中,所述计算关联属性间的波动互相关系数具体为:
[0068]
s321、对于两个等长的时间序列xi和yi,其中i=1,2,
…
,m;计算xi、yi与平均值的差之和:
[0069][0070][0071]
其中:l表示采样长度,δx(l)、δy(l)分别表示xi和yi在采样长度l下与平均值的差之和,和分别表示xi和yi的平均值;
[0072]
s322、计算分别代表xi和yi自相关性的前向差分:
[0073]
δx(l,l0)=x(l0+l)-x(l0),l0=1,2,
…
,m-l
[0074]
δy(l,l0)=y(l0+l)-y(l0),l0=1,2,
…
,m-l
[0075]
其中:l=1,2,
…
,m-1,对于每一个取样时间段l都有l0=m-l个差值,δx(l,l0)和δy(l,l0)分别表示xi和yi的自相关性的前向差分;
[0076]
s323、计算xi和yi的协方差:
[0077][0078][0079][0080]
其中:cov
xy
(l)表示xi和yi的协方差,表示
·
的平均;
[0081]
s324、计算xi和yi的波动互相关系数,若xi和yi之间存在关联性,则cov
xy
(l)满足幂
律分布其中,h
xy
为波动互相关系数,表示xi和yi相关程度;通过拟合幂律分布得到波动互相关系数h
xy
,当h
xy
=0时,表示xi和yi不相关;当h
xy
>0时,表示xi和yi正相关;当h
xy
<0时,表示xi和yi负相关;h
xy
值越大表示xi和yi的相关程度越高。
[0082]
本发明在某配电网进行电压填补的应用,采用2年的历史数据作为样本集合,为了体现填补的优势,选用k最近邻算法knn方法、随机森林算法(rf)以及本文提出的fsmdfcca,进行填补结果的分析。
[0083]
为验证填补效果的差别,均方根误差(root mean square error,rmse)策略被用于评判填补和值的真实值之间的相似程度。σ
rmse
表示填补误差,当σ
rmse
越小时,填补效果越,σ
rmse
计算如下:
[0084][0085]
式中:xr,xi为分别为真实值和填补值;n是缺失值的个数。
[0086]
accuracy表示填补精度,计算公式如下:
[0087][0088]
nr表示估计值正确个数,accuracy∈[-7%7%]。
[0089]
为分析不同缺失比例下算法填补效果的情况,构建缺失率为1%到30%间的随机缺失数据集。采用本fsmdfcca、rf、以及knn进行实验,比较均方根误差和填补准确度。以实际区域电网某节点的电压缺失值作为填补目标,分析不同缺失条件下的电压缺失数据填补误差,如图3所示。从图中可以看出本文提出的fsmdfcca算法获得的填补效果最好,同时从图中也可以明显看出,随着缺失率的提高,rf和knn的误差有明显的增长,fsmdfcca算法则相对平稳,尤其是当缺失率大于15%以后误差的变化不明显。图4给出了3种算法在缺失度不同背景下的填补准确度情况,从图中可明显可以看出,fsmdfcca相比rf和knn具有更好的填补效果。为进一步体现fsmdfcca的优势,本文以缺失率为15%的情况为例进行分析。图5给出了连续30组数据在某一缺失情况下的比对分析,从图中结果可以明显看出,本文提出的fsmdfcca算法所绘制的曲线和真实值曲线具有较好的贴合度,填补结果接近真实值,填补效果明显。
[0090]
以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,应视为本发明的保护范围。
技术特征:
1.一种基于波动互相关分析的配网电压异常数据填补方法,其特征在于,包括如下步骤:s1、获取电网的历史数据;s2、将历史数据划分为训练集和测试集;s3、基于属性加权策略构建相似集合wz;s4、通过n-bootstrap抽样方法构建随机森林;s5、采用相似集合wz对随机森林进行训练,并通过测试集对训练后的随机森林模型进行测试;s6、判断训练后的随机森林模型是否满足测试要求,如果训练后的随机森林模型满足测试要求,转入步骤s7,否则转入步骤s5继续训练;s7、采用训练完成的随机森林模型对电压异常值进行预测,预测结果作为填补结果;s8、结束本次填补。2.根据权利要求1所述的基于波动互相关分析的配网电压异常数据填补方法,其特征在于,步骤s3具体包括:s31、获取电压关联属性集合sx
i
,i=1,2,
……
,u,其中,u表示关联属性的个数;s32、采用波动互相关系数分析关联属性间的互相相关情况,设定阀值δ,计算关联属性间的波动互相关系数,当波动互相关系数值大于阀值δ时,将该关联属性存入属性集合wg;s33、将属性集合wg中的关联属性采用熵权法获得各关联属性的权重w,w=[w1,w2,...,w
m
],m表示属性集合wg中的关联属性的数量;s34、根据波动互相关系数得到关联属性综合加权值jq,jq=w1sx1+w2sx2+...+w
m
sx
m
;s35、从训练集中挑选各个典型时段的历史数据断面并计算对应的关联属性综合加权值jq,并将关联属性综合加权值jq从大到小进行排序,给定关联阈值b,若历史数据断面的关联属性综合加权值jq大于给定的阈值b,则将历史数据断面存入相似集合wz。3.根据权利要求1所述的基于波动互相关分析的配网电压异常数据填补方法,其特征在于,步骤s4具体包括:s41、对随机森林中的每一棵cart决策树,通过n-bootstrap抽样从初始样本集合s中抽取样本,并构建n个子集{s1,s2,
…
,s
n
},将n个子集合中一半的样本作为训练样本集s
ntr
,另一半样本作为测试样本集n
nte
;s42、从训练样本集s
ntr
中任选样本作为根节点进行训练,并构建多指标融合分裂系数rh(s
ntr
)作为节点是否分裂的衡量指标:要求α∈{0,1},且α,不能相等,其中,gini()表示基尼系数,gain()表示信息增益;计算测试集合中最小的融合分裂系数值min{rh(s
ntr
)},作为节点分裂的判断标准进行分裂操作;节点分裂完成后形成决策树;s43、最后将生成的所有决策树构建随机森林。4.根据权利要求2所述的基于波动互相关分析的配网电压异常数据填补方法,其特征在于,步骤s32中,所述计算关联属性间的波动互相关系数具体为:s321、对于两个等长的时间序列x
i
和y
i
,其中i=1,2,
…
,m;计算x
i
、y
i
与平均值的差之
和:和:其中:l表示采样长度,δx(l)、δy(l)分别表示x
i
和yi在采样长度l下与平均值的差之和,和分别表示x
i
和y
i
的平均值;s322、计算分别代表x
i
和y
i
自相关性的前向差分:δx(l,l0)=x(l0+l)-x(l0),l0=1,2,
…
,m-lδy(l,l0)=y(l0+l)-y(l0),l0=1,2,
…
,m-l其中:l=1,2,
…
,m-1,对于每一个取样时间段l都有l0=m-l个差值,δx(l,l0)和δy(l,l0)分别表示x
i
和yi的自相关性的前向差分;s323、计算x
i
和y
i
的协方差:的协方差:的协方差:其中:cov
xy
(l)表示x
i
和y
i
的协方差,表示
·
的平均;s324、计算x
i
和y
i
的波动互相关系数,若x
i
和y
i
之间存在关联性,则cov
xy
(l)满足幂律分布其中,h
xy
为波动互相关系数,表示x
i
和y
i
相关程度;通过拟合幂律分布得到波动互相关系数h
xy
。5.根据权利要求2所述的基于波动互相关分析的配网电压异常数据填补方法,其特征在于,步骤s31中,所述关联属性包括有功功率、无功功率、电流、温度、湿度和临近点电压。6.根据权利要求1所述的基于波动互相关分析的配网电压异常数据填补方法,其特征在于,步骤s6中,所述判断训练后的随机森林模型是否满足测试要求采用的方法为计算预测值和真实值之间的均方根误差。
技术总结
本发明公开了一种基于波动互相关分析的配网电压异常数据填补方法,属于电力系统电压辨识技术领域,该方法包括:S1、获取电网的历史数据;S2、输入历史样本,将样本划分为:训练集和测试集;S3、基于属性加权策略构建相似集合WZ;S4、采用相似集合WZ对随机森林进行训练;S5、通过N-Bootstrap抽样方法构建随机森林。S6、采用训练集对随机森林进行训练,并采用测试集对训练后的模型进行测试;S7、如果满足测试要求,转入步骤8,否则转入步骤6继续训练;S8、采用训练完成的随机森林模型对电压异常值进行预测,预测结果作为填补结果;S9、结束本次填补。本发明能够充分利用电压历史数据进行电压缺失值的填补,提高了电压填补值的准确性。提高了电压填补值的准确性。提高了电压填补值的准确性。
技术研发人员:杨芳 陈廉曹 陈掌 王刚 姜良巧 庄宇佳 郑孝杰 张衍 卢汪俊 涂洪露 刘清 陈晶鑫
受保护的技术使用者:国网福建省电力有限公司罗源县供电公司
技术研发日:2023.05.19
技术公布日:2023/8/14
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/