风电功率预测方法、装置、电子设备及可读存储介质与流程
未命名
07-15
阅读:143
评论:0

1.本发明涉及风电功率预测技术领域,具体地涉及一种风电功率预测方法、一种风电功率预测装置、一种电子设备及一种可读存储介质。
背景技术:
2.风电功率预测是指新能源发电企业在某时空条件下,对未来一段时间内的发电能力的预测。精准的发电功率预测不仅仅可以为发电企业提供精准的集团侧以及区域发电计划、为场站侧智能运检提供辅助支持,减少两个细则考核,为源网和谐提供基础保证,还可以为电力市场现货交易提供数据支持。
3.目前,风电场功率预测普遍使用场级数值气象预报数据结合单一数学模型,根据风电机组历史某一段时间的运行情况,实现对未来风电功率的预报。但采用此方法,预测模型相对单一,不具有普适性,且需要人工进行特征选择、数据清洗、修改模型参数的情况较为常见,无法做到利用风电机组实时数据滚动预报的模式,既降低了预报的精准度,也增加了人工成本,自动化水平较低。
技术实现要素:
4.本发明实施方式的目的是提供一种风电功率预测方法,以至少解决上述的现有技术中,功率预测模型相对单一,不具有普适性,需要人工进行特征选择、数据清洗、修改模型参数,无法做到利用风电机组实时数据滚动预报的模式,预报精准度低,人工成本高,自动化水平低的问题。
5.为了实现上述目的,本发明第一方面提供一种风电功率预测方法,所述方法包括:
6.获取未来预设周期内的气象预报数据;
7.将所述气象预报数据作为多个基础预测模型的输入,得到多个第一预测值;
8.将所述气象预报数据和所述第一预测值作为多个集成预测模型的输入,得到多个第二预测值;
9.基于多个第二预测值,确定风电机组在未来预设周期内的风电功率。
10.可选的,所述基础预测模型通过以下步骤得到:
11.获取训练数据集,所述训练数据集包括预设周期内的历史气象数据和风电机组的历史运行数据;
12.对所述训练数据集中的数据进行数据预处理,得到处理后的训练数据集;
13.将所述处理后的训练数据集作为多个不同机器学习算法的训练样本,训练得到多个基础预测模型。
14.可选的,所述集成预测模型通过以下步骤得到:
15.将所述处理后的训练数据集和每一基础预测模型的预测值作为多个不同机器学习算法的训练样本,训练得到多个集成预测模型。
16.可选的,机器学习算法包括:极端梯度提升算法、快速梯度提升算法和随机森林算
法。
17.可选的,对所述训练数据集中的数据进行数据预处理,得到处理后的训练数据集,包括:
18.对训练数据集中的数据进行数据清洗、数据填充和数据归一化,得到处理后的训练数据集。
19.可选的,对训练数据集中的数据进行数据清洗,包括:
20.对于有运行状态标识的数据,利用运行状态标识进行数据清洗;
21.对于无运行状态标识的数据,采用无监督机器学习算法进行数据清洗。
22.可选的,基于多个第二预测值,确定风电机组在未来预设周期内的风电功率,包括:
23.利用线性算法对多个第二预测值进行融合,确定风电机组在未来预设周期内的风电功率。
24.本发明第二方面提供一种风电功率预测装置,所述装置包括:
25.数据获取模块,用于获取未来预设周期内的气象预报数据;
26.第一预测值确定模块,用于将所述气象预报数据作为多个基础预测模型的输入,得到多个第一预测值;
27.第二预测值确定模块,用于将所述气象预报数据和所述第一预测值作为多个集成预测模型的输入,得到多个第二预测值;
28.风电功率确定模块,用于基于多个第二预测值,确定风电机组在未来预设周期内的风电功率。
29.本发明第三方面提供一种一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述的风电功率预测方法。
30.另一方面,本发明提供一种机器可读存储介质,该机器可读存储介质上存储有指令,该指令用于使得机器执行上述的风电功率预测方法。
31.本技术方案首先对获取的数据进行数据预处理,使得输入的数据更加准确,其次,利用基础预测模型和集成预测模型相结合的方式,实现风电机组的功率预测,预测结果精准,准确率更高,本技术方案的功率预测方法可以应用于所有的风电场,具有良好的适应性。
32.本发明实施方式的其它特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
33.附图是用来提供对本发明实施方式的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本发明实施方式,但并不构成对本发明实施方式的限制。在附图中:
34.图1是本发明提供的风电功率预测方法的流程图;
35.图2是本发明提供的基础预测模型和集成预测模型的训练流程框图;
36.图3是本发明提供的风电功率预测装置结构示意图。
37.附图标记说明
38.10-数据获取模块;
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
20-第一预测值确定模块;
39.30-第二预测值确定模块;
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
40-风电功率确定模块。
具体实施方式
40.以下结合附图对本发明的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明,并不用于限制本发明。
41.图1是本发明提供的风电功率预测方法的流程图;图2是本发明提供的基础预测模型和集成预测模型的训练流程框图;图3是本发明提供的风电功率预测装置结构示意图。
42.如图1-2所示,本发明实施方式提供一种风电功率预测方法,所述方法包括:
43.步骤101、获取未来预设周期内的气象预报数据;
44.步骤102、将所述气象预报数据作为多个基础预测模型的输入,得到多个第一预测值;
45.步骤103、将所述气象预报数据和所述第一预测值作为多个集成预测模型的输入,得到多个第二预测值;
46.步骤104、基于多个第二预测值,确定风电机组在未来预设周期内的风电功率。
47.具体地,在步骤101中,未来预设周期可以设置为从当前时刻起的未来12个小时、从当前时刻起的未来24个小时等;气象预报数据可以采用气象预报部分发布的风电机组所处的未来预设周期的风电场的气象数据;其中,由于获取的未来预设周期的气象数据可能存在数据缺失、数据异常等异常数据,而采用异常数据进行预测,会导致预测结果不准确,因此,可采用数据处理方法对获取的数据进行数据预处理,得到准确的输入数据,以提高预测的准确性。具体地,在数据剔除过程中,可以求取一段数据的平均值,对于该段数据中数据值超过平均值最大和最小的数据进行剔除。在数据填充过程中,数据的缺失值按照0进行填充,使得数据保持完整;另外,还可以使用缺失数值所在行、列或预设长度区间内的数据的均值、中位数、众数来替代缺失值;还可以采用缺失值前一个值和后一个值的平均数。在另一种实施方式中,对于数据的缺失值,还可以采用数据拟合的方式进行填充,具体可采用回归算法、极大似然估计算法、随机森林算法等方式进行填充陪。在步骤102中,基础预测模型为利用训练样本提前训练出的模型,且模型的数量为多个,将经过数据预处理后的气象预报数据作为每一个基础预测模型的输入,便能够得到多个第一预测值,其中,每一基础预测模型会对应输出一个第一预测值。在步骤103中,集成预测模型为利用训练样本提前训练出的模型,且模型的数量为多个,将处理后的气象预报数据和多个第一预测值进行数据融合后,再分别作为多个集成预测模型的输入,能够得到多个第二预测值,其中,每一集成预测模型会对应输出一个第二预测值。因为每一个模型对于不同的数据集有着不同的参数,在本实施方式汇中可以利用k-fold cross-validation(k折交叉验证)的方法,对数据进行融合,重新使用训练数据,减少预测结果的方差,避免过拟合和模型低效的表现。在步骤104、在每一个集成预测模型输出一个第二预测值后,由于存在多个集成预测模型,因此,第二预测值也同样为多个,因此,需要将得到的多个第二预测值进行融合,将融合后的结果,作为风电机组在未来预设周期内的风电功率。
48.本发明将原始数据和基础预测模型的输出同时作为集成预测模型的输入,在预测结果方面,有效地减少了单一模型造成的过拟合和突出影响,并利用基础模型之间的相互
作用提供增强的预测能力;在效率方面,各模型之间并行计算,避免模型之间串行的影响。将单场数据输入改变为区域级或集团级数据输入,基础预测模型可视为单个风电场的模型输出,经模型融合与模型加权,输出更高层级的数据输出,且每一个基础预测模型可并行且互不影响,提升了大规模功率预测模型运行效率。
49.在另一种实施方式中,通过本技术方案预测得到的风电功率与采用常规方法(即:采用单一模型进行功率预测)得到的风电机组发电功率,可以采用以下公式:进行准确性验证。相比行业现有的应用现状:功率预测模型多采用单场单一模型、模型准确率普遍不高、模型优化迭代周期长、人工参与多等痛点问题,本发明的风功率预测建模的自动机器学习思路与方法,并在实际应用中,预测结果相比最优的单一模型,准确率提升1个百分点以上。
50.进一步地,所述基础预测模型通过以下步骤得到:
51.获取训练数据集,所述训练数据集包括预设周期内的历史气象数据和风电机组的历史运行数据;
52.对所述训练数据集中的数据进行数据预处理,得到处理后的训练数据集;
53.将所述处理后的训练数据集作为多个不同机器学习算法的训练样本,训练得到多个基础预测模型。
54.进一步地,所述集成预测模型通过以下步骤得到:
55.将所述处理后的训练数据集和每一基础预测模型的预测值作为多个不同机器学习算法的训练样本,训练得到多个集成预测模型。
56.具体地,因为每一个模型对于不同的数据集有着不同的参数,将所述处理后的训练数据集和每一基础预测模型的预测值作为多个不同机器学习算法的训练样本前,在本实施方式汇中可以利用k-fold cross-validation(k折交叉验证)的方法,对数据进行融合,重新使用训练数据,减少预测结果的方差;交叉验证是在机器学习建立模型和验证模型参数时常用的办法。重复的使用数据,把得到的样本数据进行切分,组合为不同的训练集和测试集,用训练集来训练模型,用测试集来评估模型预测的好坏;除此之外,在模型训练过程中,通过人工输入一个训练时间限制,避免因数据量过大或者模型过于复杂造成的低效表现。
57.除利用k折交叉验证外,本实施方式中还可以采用简单交叉验证、s折交叉验证和留一交叉验证方法。
58.其中,简单交叉验证方法指:随机的将样本数据分为两部分(比如:70%的训练集,30%的测试集),然后用训练集来训练模型,在测试集上验证模型及参数。然后继续再把样本打乱,重新选择训练集和测试集,继续训练数据和检验模型。最后我们选择损失函数评估最优的模型和参数。
59.s折交叉验证(s-folder cross validation):和简单交叉验证方法不同,s折交叉验证会把样本数据随机的分成s份,每次随机的选择s-1份作为训练集,剩下的1份做测试集。当本轮完成后,重新随机选择s-1份来训练数据。若干轮(小于s)之后,选择损失函数评估最优的模型和参数。
60.留一交叉验证(leave-one-out cross validation):它是s折交叉验证方法的特
例,此时s等于样本数n,这样对于n个样本,每次选择n-1个样本来训练数据,留一个样本来验证模型预测的好坏。此方法主要用于样本量非常少的情况。
61.在训练过程中,记录每一个单模型的rmse、训练时间与验证时间,以备后续模型的替换和选择。基础预测模型的输出作为下一层集成预测模型的输入,可以减少单一模型带来的过拟合情况,改进单一模型预测的缺点,并利用基础预测模型之间的相互作用提供增强的预测能力;原始数据继续作为下一层的输入,可以使高层继续利用原始数据训练,可以更好地减少单一模型的过拟合情况。
62.进一步地,多个机器学习算法包括:极端梯度提升算法、快速梯度提升算法和随机森林算法。
63.具体地,本实施方式中采用回归模型进行模型训练,例如xgboost(extreme gradient boosting,极端梯度提升算法)、lightgbm(light gradient boosting machine,快速梯度提升算法)、randomforest(随机森林算法)等多种机器学习模型作为基础模型层,以并行的方式,分别输出其预测发电功率。
64.其中,xgboost(extreme gradient boosting,极端梯度提升算法)的具体原理为:不断进行特征分裂的树模型,每一棵新树拟合前一次预测的残差,并用二阶泰勒展开快速准确地进行梯度下降,并用正则项控制过拟合,拥有快速、并行处理中小型数据集的优势。
65.lightgbm(light gradient boosting machine,快速梯度提升算法)的具体原理为:采用直方图算法进行加速,训练中采用单边梯度算法过滤样本和基于每次从当前所有叶子中找到分裂增益最大的一个叶子进行分裂,从而拥有更快的训练速度和更高的效率,以及降低内存使用率,和较好的准确性。
66.randomforest(random decision forests,随机森林算法)的具体原理为:基于有放回抽样和属性分裂的树算法,对于各类问题拥有较好的适应性。
67.进一步地,对所述训练数据集中的数据进行数据预处理,得到处理后的训练数据集,包括:
68.对训练数据集中的数据进行数据清洗、数据填充和数据归一化,得到处理后的训练数据集。
69.具体地,在数据填充过程中,数据的缺失值按照0进行填充,使得数据保持完整;另外,还可以使用缺失数值所在行、列或预设长度区间内的数据的均值、中位数、众数来替代缺失值;还可以采用缺失值前一个值和后一个值的平均数。在另一种实施方式中,对于数据的缺失值,还可以采用数据拟合的方式进行填充,具体可采用回归算法、极大似然估计算法、随机森林算法等方式进行填充。
70.数据归一化可以理解为时数据的标准化,将数据按比例缩放,使之落入一个小的特定区间。在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权,提高分类器的准确性。在本实施方式中可以采用以下公式进行归一化处理:其中,x
max
为样本数据的最大值,x
min
为样本数据的最小值。
71.进一步地,对训练数据集中的数据进行数据清洗,包括:
72.对于有运行状态标识的数据,利用运行状态标识进行数据清洗;
73.对于无运行状态标识的数据,采用无监督机器学习算法进行数据清洗。
74.具体地,在本实施方式中,有运行状态标识可以为:数据具有对应的时间、地点、风电机组序号等状态,在无运行信号数据情况下的非监督机器学习异常数据判别与还原的思路和方法,在实际应用中对离群数据数据进行剔除或还原,真实的反映了风电机组在该运行条件下的理论发电能力,为后续建立功率预测模型的应用,奠定数据基础。无监督机器学习算法可以例如k-means(k均值算法)或dbscan(density-based spatial clustering of applications with noise,密度聚类法),进而得到较为干净的风电机组(风电场)数据。
75.进一步地,基于多个第二预测值,确定风电机组在未来预设周期内的风电功率,包括:
76.利用线性算法对多个第二预测值进行融合,确定风电机组在未来预设周期内的风电功率。
77.具体地,在本实施方式中,线性算法可采用线性回归算法,其权重通过训练得到的。线性回归是利用称为线性回归方程的最小平方函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。这种函数是一个或多个称为回归系数的模型参数的线性组合。回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。
78.如图3所示,本发明实施方式还提供一种风电功率预测装置,所述装置包括:
79.数据获取模块10,用于获取未来预设周期内的气象预报数据;
80.第一预测值确定模块20,用于将所述处理后的气象预报数据作为多个基础预测模型的输入,得到多个第一预测值;
81.第二预测值确定模块30,用于将所述处理后的气象预报数据和所述第一预测值作为多个集成预测模型的输入,得到多个第二预测值;
82.风电功率确定模块40,用于基于多个第二预测值,确定风电机组在未来预设周期内的风电功率。
83.本发明实施方式还提供一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述的风电功率预测方法。
84.本发明实施方式还提供一种可读存储介质,该可读存储介质上存储有指令,该指令用于使得机器执行上述的风电功率预测方法。
85.本领域技术人员可以理解实现上述实施方式的方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得单片机、芯片或处理器(processor)执行本发明各个实施方式所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
86.以上结合附图详细描述了本发明的可选实施方式,但是,本发明实施方式并不限于上述实施方式中的具体细节,在本发明实施方式的技术构思范围内,可以对本发明实施方式的技术方案进行多种简单变型,这些简单变型均属于本发明实施方式的保护范围。另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,
可以通过任何合适的方式进行组合。为了避免不必要的重复,本发明实施方式对各种可能的组合方式不再另行说明。
87.此外,本发明的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明实施方式的思想,其同样应当视为本发明实施方式所公开的内容。
技术特征:
1.一种风电功率预测方法,其特征在于,所述方法包括:获取未来预设周期内的气象预报数据;将所述气象预报数据作为多个基础预测模型的输入,得到多个第一预测值;将所述气象预报数据和所述第一预测值作为多个集成预测模型的输入,得到多个第二预测值;基于多个第二预测值,确定风电机组在未来预设周期内的风电功率。2.根据权利要求1所述的风电功率预测方法,其特征在于,所述基础预测模型通过以下步骤得到:获取训练数据集,所述训练数据集包括预设周期内的历史气象数据和风电机组的历史运行数据;对所述训练数据集中的数据进行数据预处理,得到处理后的训练数据集;将所述处理后的训练数据集作为多个不同机器学习算法的训练样本,训练得到多个基础预测模型。3.根据权利要求2所述的风电功率预测方法,其特征在于,所述集成预测模型通过以下步骤得到:将所述处理后的训练数据集和每一基础预测模型的预测值作为多个不同机器学习算法的训练样本,训练得到多个集成预测模型。4.根据权利要求3所述的风电功率预测方法,其特征在于,机器学习算法包括:极端梯度提升算法、快速梯度提升算法和随机森林算法。5.根据权利要求2所述的风电功率预测方法,其特征在于,对所述训练数据集中的数据进行数据预处理,得到处理后的训练数据集,包括:对训练数据集中的数据进行数据清洗、数据填充和数据归一化,得到处理后的训练数据集。6.根据权利要求5所述的风电功率预测方法,其特征在于,对训练数据集中的数据进行数据清洗,包括:对于有运行状态标识的数据,利用运行状态标识进行数据清洗;对于无运行状态标识的数据,采用无监督机器学习算法进行数据清洗。7.根据权利要求1所述的风电功率预测方法,其特征在于,基于多个第二预测值,确定风电机组在未来预设周期内的风电功率,包括:利用线性算法对多个第二预测值进行融合,确定风电机组在未来预设周期内的风电功率。8.一种风电功率预测装置,其特征在于,所述装置包括:数据获取模块,用于获取未来预设周期内的气象预报数据;第一预测值确定模块,用于将所述气象预报数据作为多个基础预测模型的输入,得到多个第一预测值;第二预测值确定模块,用于将所述气象预报数据和所述第一预测值作为多个集成预测模型的输入,得到多个第二预测值;风电功率确定模块,用于基于多个第二预测值,确定风电机组在未来预设周期内的风电功率。
9.一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-7中任一项所述的风电功率预测方法。10.一种可读存储介质,该可读存储介质上存储有指令,该指令用于使得机器执行权利要求1-7中任一项所述的风电功率预测方法。
技术总结
本发明提供一种风电功率预测方法、装置、电子设备及可读存储介质,属于风电功率预测技术领域。所述方法包括:获取未来预设周期内的气象预报数据;将所述气象预报数据作为多个基础预测模型的输入,得到多个第一预测值;将所述气象预报数据和所述第一预测值作为多个集成预测模型的输入,得到多个第二预测值;基于多个第二预测值,确定风电机组在未来预设周期内的风电功率。本发明具有预测结果精准,准确率高,应用于所有的风电场,适应性强的优点。适应性强的优点。适应性强的优点。
技术研发人员:仲义 赵冰 刘轩 张斌 李晓璐 陈誉天 董健 汪正军
受保护的技术使用者:国电联合动力技术有限公司
技术研发日:2023.02.27
技术公布日:2023/7/12
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/