一种基于时空聚类及决策树的风机异常值修复方法与流程

未命名 08-26 阅读:95 评论:0


1.本发明涉及风力发电领域的风机异常值修复技术领域,尤其涉及一种基于时空聚类及决策树的风机异常值修复方法。


背景技术:

2.据调查,风力发电每发一度电,所消耗的碳仅有火力发电的1%。电网调度部门要进行合理的发电计划安排,提高电网运行的经济性、安全性、可靠性,因此风电功率的预测,成为至关重要的一环。
3.一般风机均有自身的风速-功率曲线,可由风速来预估功率,但是由于测风仪器故障、电网限电等问题,采集到的风速和实际发电功率,存在很多异常值,导致并不符合理想条件下的风速-功率曲线。对风场来说,风功率预测精度达不到国家标准,会被除以一定数额的罚款,并且可能对电网造成损害。单个风场下,往往有数十甚至上百台风机,风机之间的地理位置及风机间的尾流,使得风机间的风速相互影响,使得通过风速-功率曲线对风机风电功率异常值的预测准确率较低。


技术实现要素:

4.本发明提供一种基于时空聚类及决策树的风机异常值修复方法,以克服上述技术问题。
5.为了实现上述目的,本发明的技术方案是:
6.一种基于时空聚类及决策树的风机异常值修复方法,包括如下步骤:
7.s1:获取风场内的风机所在位置的经纬度,以对风场内的风机进行空间聚类,获取若干风机位置类;确定风机位置类中的待进行功率异常值修复的目标风机和不需要进行功率异常值修复的若干参考风机;
8.s2:获取所述风机位置类内的风机的风速,以获取第一时间段阈值内的日风速曲线和日风速一阶差分曲线;
9.s3:获取参考风机与目标风机的日风速曲线之间的欧式距离,并根据所述欧式距离,对若干所述参考风机按照欧式距离从小到大进行排名;获取第i个参考风机按照欧式距离进行排名的第一日排名序号,i=1,2

i,其中i为风机位置类内的参考风机的编号,i为风机位置类内的参考风机总数;
10.s4:获取参考风机与目标风机的日风速一阶差分曲线之间的余弦相似度,并根据所述余弦相似度,按照余弦相似度从大到小进行排名;获取第i个参考风机按照余弦相似度进行排名的第二日排名序号;
11.s5:根据所述第一日排名序号,获取在第一时间段阈值内的第i个参考风机按照欧式距离进行排名的第一日排名序号平均值;
12.根据所述第二日排名序号,获取在第一时间段阈值内的第i个参考风机按照余弦相似度进行排名的第二日排名序号平均值;
13.s6:根据第i个参考风机的第一日排名序号平均值,获取第一参考风机序列;
14.根据第i个参考风机的第二日排名序号平均值,获取第二参考风机序列;
15.s7:根据所述第一参考风机序列和第二参考风机序列,获取目标风机的相似参考风机;
16.s8:根据目标风机的待进行功率异常值修复时刻的前t个时刻的功率值,和相似参考风机的待进行功率异常值修复时刻的前t个时刻的功率值,基于决策树模型,获取目标风机待进行功率异常值修复时刻的修复后的功率值,以对目标风机的异常值进行修复。
17.进一步的,所述s5中,获取第i个参考风机的第一日排名序号平均值方法如下:
[0018][0019]
其中,fi表示第i个参考风机的第一日排名序号平均值;t表示第一时间段阈值内的天数的编号;t表示第一时间段阈值内的总天数;表示第t天的第i个参考风机的第一日排名序号。
[0020]
进一步的,所述s5中,获取第i个参考风机的第二日排名序号平均值方法如下:
[0021][0022]
其中,ci表示第i个参考风机的第二日排名序号平均值;表示第t天的第i个参考风机的第二日排名序号。
[0023]
进一步的,所述s6中,获取第一参考风机序列的方法为:
[0024]
将所述若干所述参考风机按照第i个参考风机的第一日排名序号平均值从小到大的顺序进行排序,获取第一参考风机序列;
[0025]
获取第二参考风机序列的方法为:
[0026]
将所述若干所述参考风机按照第i个参考风机的第二日排名序号平均值从小到大的顺序进行排序,获取第二参考风机序列。
[0027]
进一步的,所述s7中,获取所述相似参考风机方法如下:
[0028]
s71:假设第一参考风机序列为cw1={w1,w2,

,wm,

,wi};
[0029]
假设第二参考风机序列为cw2={w1,w2,

,wn,

,wi};
[0030]
其中,m为按照第一日排名序号平均值进行排序的第一参考风机序列中的风机编号;n为按照第二日排名序号平均值进行排序的第二参考风机序列中的风机编号;其中,m≤i,n≤i;
[0031]
s72:取第一参考风机序列的前n个参考风机,记为第一参考风机组cwz1;
[0032]
取第二参考风机序列的前n个参考风机,记为第二参考风机组cwz2;
[0033]
可得:
[0034]
xs=cwz1∩cwz2[0035]
其中,xs表示相似参考风机集合。
[0036]
进一步的,确定待进行功率异常值修复的目标风机方法如下:
[0037]
当风机满足:
[0038]
风机所接收的风速大于切入风速且小于切出风速,风机的功率为0;
[0039]
或者风机所接收的风速大于风机的额定风速,风机的功率低于设定功率阈值;
[0040]
或者风机所接收的风速小于风机的额定风速,风机的功率不等于0;
[0041]
此时所述风机为待进行功率异常值修复的目标风机。
[0042]
有益效果:本发明的一种基于时空聚类及决策树的风机异常值修复方法,通过对风机的空间地理位置进行聚类,对聚类后的风机位置类内的目标风机和参考风机之间的相似性进行分析,得到目标风机的相似参考风机,在获取目标风机待进行异常值修复的时刻的前t个时刻的功率值后,基于决策树模型对当前时刻目标风机的异常值进行预测并修复。能够提高风功率预测的准确率,提高风场的经济效益,为高精度风功率预测打下坚实的基础。
附图说明
[0043]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0044]
图1为本发明的风机异常值修复方法流程图;
[0045]
图2为本发明的实施例中的kmeans聚类方法示意图;
[0046]
图3为本发明的实施例中的理想条件下的风速功率曲线示意图;
[0047]
图4为本发明的实施例中的存在传感器故障、电网限电时的风速-功率曲线呈示意图。
具体实施方式
[0048]
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0049]
本实施例提供了一种基于时空聚类及决策树的风机异常值修复方法,如图1所示,
[0050]
s1:获取风场内的风机所在位置的经纬度,以对风场内的风机进行空间聚类,获取若干风机位置类;确定风机位置类中的待进行功率异常值修复的目标风机和不需要进行功率异常值修复的若干参考风机;具体的,所述风机位置类中有多个风机,包括待进行功率异常值修复的目标风机和不需要进行功率异常值修复的若干参考风机;
[0051]
s2:获取所述风机位置类内的风机的风速,以获取第一时间段阈值内的日风速曲线和日风速一阶差分曲线;
[0052]
具体的,根据风场内各风机的经纬度,对风机进行空间聚类,本实施例中的聚类方法为kmeans,如图2所示;获取每天风机一年内的每天的风速曲线和风速一阶差分曲线。其中,根据风机的风速,获取日风速曲线和日风速一阶差分曲线的方法为领域内的常规方法,这里不进行具体介绍。
[0053]
s3:获取参考风机与目标风机的日风速曲线之间的欧式距离,并根据所述欧式距
离,对若干所述参考风机按照欧式距离从小到大进行排名;获取第i个参考风机按照欧式距离进行排名的第一日排名序号,i=1,2

i,其中i为风机位置类内的参考风机的编号,i为风机位置类内的参考风机总数;
[0054]
具体的,假设在聚类后的风机位置类a group内,有4台风机,其中#1风机为目标风机,#2,#3,#4为参考风机;如20221001这一天,对于#1目标风机,#3风机与#1的日风速曲线之间的欧式距离最小,#2次之,#4再次之,记为20221001,那么对于#1,#2、#3、#4的排名为2、1、3;欧式距离的大小代表的是目标风机与参考风机的功率之间的相似度,欧式距离越小,表明目标风机与参考风机之间的功率相似度越大,在本实施例中的排名越靠前,日排名序号越小。
[0055]
s4:获取参考风机与目标风机的日风速一阶差分曲线之间的余弦相似度,并根据所述余弦相似度,按照余弦相似度从大到小进行排名;获取第i个参考风机按照余弦相似度进行排名的第二日排名序号;
[0056]
具体的,如20221001这一天,对于#1目标风机,#3与#1的日风速一阶差分曲线之间的余弦相似度最大,#2次之,#4再次之,记为20221001,那么对于#1,#2、#3、#4的排名为2、1、3;其中,余弦相似度越大,表明目标风机与参考风机之间的功率相似度越大,在本实施例中的排名越靠前,日排名序号越小。
[0057]
s5:根据所述第一日排名序号,获取在第一时间段阈值内的第i个参考风机按照欧式距离进行排名的第一日排名序号平均值;
[0058]
根据所述第二日排名序号,获取在第一时间段阈值内的第i个参考风机按照余弦相似度进行排名的第二日排名序号平均值;
[0059]
优选地,获取第i个参考风机的第一日排名序号平均值方法如下:
[0060][0061]
其中,fi表示第i个参考风机的第一日排名序号平均值;t表示第一时间段阈值内的天数的编号;t表示第一时间段阈值内的总天数;表示第t天的第i个参考风机的第一日排名序号;
[0062]
优选地,获取第i个参考风机的第二日排名序号平均值方法如下:
[0063][0064]
其中,ci表示第i个参考风机的第二日排名序号平均值;表示第t天的第i个参考风机的第二日排名序号;
[0065]
s6:按照参考风机的第一日排名序号平均值从小到大的顺序,将所述风机位置类中的所有的参考风机进行排序,获取第一参考风机序列;
[0066]
按照参考风机的第二日排名序号平均值从小到大的顺序,将所述风机位置类中的所有的参考风机进行排序,获取第二参考风机序列;
[0067]
s7:根据所述第一参考风机序列和第二参考风机序列,获取目标风机的相似参考风机;
[0068]
优选地,获取所述相似参考风机方法如下:
[0069]
s71:假设第一参考风机序列为cw1={w1,w2,

,wm,

,wi};
[0070]
假设第二参考风机序列为cw2={w1,w2,

,wn,

,wi};
[0071]
其中,m为按照第一日排名序号平均值进行排序的第一参考风机序列中的风机编号;n为按照第二日排名序号平均值进行排序的第二参考风机序列中的风机编号;其中,m≤i,n≤i;
[0072]
s72:取第一参考风机序列的前n个参考风机,记为第一参考风机组cwz1;
[0073]
取第二参考风机序列的前n个参考风机,记为第二参考风机组cwz2;
[0074]
可得:
[0075]
xs=cwz1∩cwz2[0076]
其中,xs表示相似参考风机集合,集合中的参考风机就是目标风机的参考风机;在参考风机序列中所取的参考风机数量n为由技术人员人工确定。
[0077]
具体的,统计这一年内,针对目标风机的风机位置类内的参考风机平均排名状况,如对于#1目标风机,#2、#3、#4风机按照欧式距离进行排名的排名序号的平均值分别为2.2、1.3、2.8,则第一参考风机序列为{#3,#2,#4};按照余弦相似度进行排名的排名序号的平均值分别为1.8、2.2、2.9,则第二参考风机序列为{#2,#3,#4};在本实施例中,分别取第一参考风机序列和第二参考风机序列的前2个参考风机,则cwz1={#3,#2},cwz2={#2,#3},则xs={#2,#3},即取#3和2#风机为目标风机的相似参考风机;
[0078]
s8:根据目标风机的待进行功率异常值修复时刻的前t个时刻的功率值,和相似参考风机的待进行功率异常值修复时刻的前t个时刻的功率值,基于决策树模型,获取目标风机待进行功率异常值修复时刻的修复后的功率值。
[0079]
具体的,将目标风机的待进行功率异常值修复时刻的前t个时刻的功率值,和相似参考风机的待进行功率异常值修复时刻的前t个时刻的功率值,输入至基于损失函数训练后的决策树模型,既能够获取修复后的功率值。其中,决策树模型为进行数据预测使用的常规模型,本实施例中决策树模型的损失函数为采用常见的l1损失函数loss1(x,y)和l2损失函数loss2(x,y):分别如下,
[0080][0081][0082]
其中,x代表预测结果,y代表目标结果,f(
·
)代表决策树模型,x
ii
代表第ii时刻的输入,ii表示待进行功率异常值修复时刻的前t个时刻的序号;
[0083]
具体的,在本实施例中,针对#1目标风机,当前时刻为0,取#1、#2、#3 0时刻前t个时刻的历史观测数据(功率),来预测1#当前0时刻的数值;生产时,对于#1,此刻为nan的数值,使用#1、#2、#3该时刻前t个时刻的历史观测数据,来填补该nan值;以此来完成风机异常值的修复。
[0084]
具体的,本实施例的工作原理如下:
[0085]
风机存在切入风速、切出风速、额定风速,在出厂时均进行了标记。只有当风速在切入切出风速间,风机才能正常发电,当风速大于等于额定风速,小于切出风速时,风机的发电功率为额定功率,因此,理想条件下的风速功率曲线如图3所示;然而由于传感器故障、电网限电等一系列现实问题的存在,往往风速-功率曲线呈如图4所示:
[0086]
本发明的实施例中待进行功率异常值修复的目标风机具体如下特点:目标风机的风速在切入切出风速间,功率为0;风速大于额定风速,功率却较小;在风速小于切入风速时,功率不为0;异常值记为nan;
[0087]
优选地,因此本实施例中确定待进行功率异常值修复的目标风机方法如下:
[0088]
当风机满足:
[0089]
风机所接收的风速大于切入风速且小于切出风速,风机的功率为0;
[0090]
或者风机所接收的风速大于风机的额定风速,风机的功率低于设定功率阈值,本实施例的设定功率阈值为额定功率的95%;
[0091]
或者风机所接收的风速小于风机的额定风速,风机的功率不等于0;
[0092]
此时所述风机为待进行功率异常值修复的目标风机。风机位置类中的目标风机以外的风机为参考风机。
[0093]
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

技术特征:
1.一种基于时空聚类及决策树的风机异常值修复方法,其特征在于,包括如下步骤:s1:获取风场内的风机所在位置的经纬度,以对风场内的风机进行空间聚类,获取若干风机位置类;确定风机位置类中的待进行功率异常值修复的目标风机和不需要进行功率异常值修复的若干参考风机;s2:获取所述风机位置类内的风机的风速,以获取第一时间段阈值内的日风速曲线和日风速一阶差分曲线;s3:获取参考风机与目标风机的日风速曲线之间的欧式距离,并根据所述欧式距离,对若干所述参考风机按照欧式距离从小到大进行排名;获取第i个参考风机按照欧式距离进行排名的第一日排名序号,i=1,2

i,其中i为风机位置类内的参考风机的编号,i为风机位置类内的参考风机总数;s4:获取参考风机与目标风机的日风速一阶差分曲线之间的余弦相似度,并根据所述余弦相似度,按照余弦相似度从大到小进行排名;获取第i个参考风机按照余弦相似度进行排名的第二日排名序号;s5:根据所述第一日排名序号,获取在第一时间段阈值内的第i个参考风机按照欧式距离进行排名的第一日排名序号平均值;根据所述第二日排名序号,获取在第一时间段阈值内的第i个参考风机按照余弦相似度进行排名的第二日排名序号平均值;s6:根据第i个参考风机的第一日排名序号平均值,获取第一参考风机序列;根据第i个参考风机的第二日排名序号平均值,获取第二参考风机序列;s7:根据所述第一参考风机序列和第二参考风机序列,获取目标风机的相似参考风机;s8:根据目标风机的待进行功率异常值修复时刻的前t个时刻的功率值,和相似参考风机的待进行功率异常值修复时刻的前t个时刻的功率值,基于决策树模型,获取目标风机待进行功率异常值修复时刻的修复后的功率值,以对目标风机的异常值进行修复。2.根据权利要求1所述的一种基于时空聚类及决策树的风机异常值修复方法,其特征在于,所述s5中,获取第i个参考风机的第一日排名序号平均值方法如下:其中,f
i
表示第i个参考风机的第一日排名序号平均值;t表示第一时间段阈值内的天数的编号;t表示第一时间段阈值内的总天数;表示第t天的第i个参考风机的第一日排名序号。3.根据权利要求1所述的一种基于时空聚类及决策树的风机异常值修复方法,其特征在于,所述s5中,获取第i个参考风机的第二日排名序号平均值方法如下:其中,c
i
表示第i个参考风机的第二日排名序号平均值;表示第t天的第i个参考风机的第二日排名序号。4.根据权利要求1所述的一种基于时空聚类及决策树的风机异常值修复方法,其特征
在于,所述s6中,获取第一参考风机序列的方法为:将所述若干所述参考风机按照第i个参考风机的第一日排名序号平均值从小到大的顺序进行排序,获取第一参考风机序列;获取第二参考风机序列的方法为:将所述若干所述参考风机按照第i个参考风机的第二日排名序号平均值从小到大的顺序进行排序,获取第二参考风机序列。5.根据权利要求1所述的一种基于时空聚类及决策树的风机异常值修复方法,其特征在于,所述s7中,获取所述相似参考风机方法如下:s71:假设第一参考风机序列为cw1={w1,w2,

,w
m
,

,w
i
};假设第二参考风机序列为cw2={w1,w2,

,w
n
,

,w
i
};其中,m为按照第一日排名序号平均值进行排序的第一参考风机序列中的风机编号;n为按照第二日排名序号平均值进行排序的第二参考风机序列中的风机编号;其中,m≤i,n≤i;s72:取第一参考风机序列的前n个参考风机,记为第一参考风机组cwz1;取第二参考风机序列的前n个参考风机,记为第二参考风机组cwz2;可得:xs=cwz1∩cwz2其中,xs表示相似参考风机集合。6.根据权利要求1所述的一种基于时空聚类及决策树的风机异常值修复方法,其特征在于,确定待进行功率异常值修复的目标风机方法如下:当风机满足:风机所接收的风速大于切入风速且小于切出风速,风机的功率为0;或者风机所接收的风速大于风机的额定风速,风机的功率低于设定功率阈值;或者风机所接收的风速小于风机的额定风速,风机的功率不等于0;此时所述风机为待进行功率异常值修复的目标风机。

技术总结
本发明公开了一种基于时空聚类及决策树的风机异常值修复方法,通过对风机的空间地理位置进行聚类,确定风机位置类内目标风机和参考风机;获取第一时间段阈值内的日风速曲线和日风速一阶差分曲线;获取参考风机与目标风机的日风速曲线之间的欧式距离和日风速一阶差分曲线之间的余弦相似度,对聚类后的风机位置类内的目标风机和参考风机之间的相似性进行分析,得到目标风机的相似参考风机,在获取目标风机待进行异常值修复的时刻的前T个时刻的功率值后,基于决策树模型对当前时刻目标风机的异常值进行预测并修复。能够提高风功率预测的准确率,提高风场的经济效益,为高精度风功率预测打下坚实的基础。率预测打下坚实的基础。率预测打下坚实的基础。


技术研发人员:朱圣晨 马一鸣 王彬
受保护的技术使用者:米塔碳(杭州)智能科技有限公司
技术研发日:2023.05.25
技术公布日:2023/8/23
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐