一种含时滞性和非线性小样本时间序列的建模预测方法
未命名
08-14
阅读:138
评论:0

1.本发明属于预测算法技术领域,尤其涉及一种含时滞性和非线性小样本时间序列的建模预测方法。
背景技术:
2.为推动经济社会向绿色低碳转型,我国提出“碳达峰”和“碳中和”战略目标。在“双碳”目标的指引下,清洁能源因其绿色、安全和无污染的特点得到快速发展。清洁能源发电既能缓解化石能源消耗过快、对生态环境造成严重影响的问题,又能有效补充能源供给、调整能源结构。因此,科学准确地预测我国清洁能源发电量,有利于政府制定能源发展规划,确保我国能源和经济的可持续发展。然而,清洁能源发电预测具有一定的困难。第一,由于影响清洁能源发电的不确定因素较多,如气候条件和政策变化等,清洁能源发电量具有很高的不确定性和非线性特征。第二,清洁能源发电促进经济可持续发展,而经济的增长在后期也会增加对清洁能源发电量的需求,能源发电本身还存在时滞性特征。第三,随着我国能源政策和结构的不断更新和变化,历史数据对未来预测并不可靠,导致可用于建模预测的样本数据有限。
3.灰色预测模型由邓聚龙教授提出,是研究小样本和贫信息的不确定性系统建模的一种有效方法。模型是最基本的灰色模型,但该模型为固定线性结构,无法适用于非线性数据序列的建模预测。为此,吴利丰等基于新信息优先原理,首次提出分数阶累积灰色模型,即fgm(1,1)模型,它通过扩大灰色预测模型累积阶次的范围来提高预测模型的适应性。然而,该模型在求解过程中存在从微分方程到差分方程的跳跃性误差。考虑到离散模型具有无偏性,众多学者将离散化思想引入灰色模型,提出一系列离散灰色模型,避免了传统灰色模型的固有误差,从而可以更准确地拟合和预测时间数据序列。然而,目前尚未有技术可以同时考虑模型的无偏性,解决含时滞性和非线性小样本时间序列的建模预测问题。
技术实现要素:
4.本发明的目的在于提供一种含时滞性和非线性小样本时间序列的建模预测方法,其特征在于,包括如下步骤:
5.s1:获取原始数据,根据对预测问题的分析,完成对原始数据的处理;
6.s2:构建带有待定系数的分数阶时滞多项式离散灰色预测模型的时间响应式;
7.s3:采用遗传算法和最小二乘法确定分数阶时滞多项式离散灰色预测模型中的最优非线性参数;
8.s4:确定分数阶时滞多项式离散灰色预测模型的时间响应式的最后形式;
9.s5:进行数据模拟和仿真,判断是否满足模拟精度要求,当不满足模拟精度要求时,进行数据清洗,并重复s1-s5,直至满足精度要求,完成预测。
10.进一步地,s1中,设定原始非负序列x
(0)
=(x
(0)
(1),x
(0)
(2),...,x
(0)
(n))和x
(r)
=(x
(r)
(1),x
(r)
(2),...,x
(r)
(n))为x
(0)
的r阶累加生成序列。
11.进一步地,s2中,基于s1中的r阶累加生成序列,分数阶时滞多项式离散灰色预测模型的基本方程表示为:
[0012][0013]
分数阶时滞多项式离散灰色预测模型的基本方程中,非线性参数a、b、c和d皆为分数阶时滞多项式离散灰色预测模型的结构参数;非线性参数r为分数阶时滞多项式离散灰色预测模型的累加阶数,取任意实数;τ为系统延迟时间,τ=1,2,...,k,则分数阶时滞多项式离散灰色预测模型的时间响应式为:
[0014][0015]
进一步地,s3中,最小二乘法具体为:分数阶时滞多项式离散灰色预测模型的参数列p=(a,b,c,d)
t
在最小二乘准则中满足p=(a,b,c,d)
t
=(b
t
b)-1bt
y,其中b表示为:
[0016][0017]
进一步地,s3中,遗传算法具体为:针对分数阶r和最终的误差之间存在复杂的非线性关系,采用平均绝对百分比误差作为优化目标函数,并利用遗传算法搜索r的最优值,优化目标函数表示为:
[0018][0019][0020]
优化目标函数中,x
(0)
(i)为实际值;为预测值。
[0021]
进一步地,s4中,分数阶时滞多项式离散灰色预测模型的时间响应式的最后形式具体为:当k=p∈n,且p》2时,则分数阶时滞多项式离散灰色预测模型的时间响应式的最后形式表示为:
[0022][0023]
进一步地,s5中,满足模拟精度要求的判断条件具体为:
[0024][0025][0026][0027]
以上三个公式中,rmse、mae和mape的值与模型的精度成反比。当mape大于10%时,不满足模拟精度要求。
[0028]
数据清洗具体为:
[0029][0030]
与现有技术相比,本发明的有益效果主要体现在:
[0031]
1、本发明ftdp-dgm(1,1)模型考虑时滞效应对灰色系统的影响,将时滞多项式纳入分数阶离散灰色模型中,能在一定程度上提取数据序列的时滞性和非线性特征,时滞项可根据数据序列个数的变化而变化,从而提高了模型的拟合预测能力。
[0032]
2、本发明ftdp-dgm(1,1)模型的结构参数和时间响应式都是基于微分方程计算的,避免了传统灰色模型由连续过渡到离散产生的跳跃性误差,此外,利用遗传算法寻找分数阶参数的最优值,进一步提高了模型精度。
[0033]
3、本发明利用ftdp-dgm(1,1)模型对我国2011-2020年的水力发电、风力发电和核能发电进行模拟预测,结果验证了该模型的有效性和适应性。
附图说明
[0034]
图1为本发明一种含时滞性和非线性小样本时间序列的建模预测方法的流程图;
[0035]
图2为我国2011-2020年的水力、风力和核能发电量曲线示意图。
具体实施方式
[0036]
下面将结合示意图对本发明一种含时滞性和非线性小样本时间序列的建模预测方法进行更详细的描述,其中表示了本发明的优选实施例,应该理解本领域技术人员可以修改在此描述的本发明,而仍然实现本发明的有利效果,因此,下列描述应当被理解为对于本领域技术人员的广泛知道,而并不作为对本发明的限制。
[0037]
本发明分数阶时滞多项式离散灰色预测模型,即ftdp-dgm(1,1)模型可以根据数据特征选择合适的分数阶,以适应不同的时间数据序列。该模型同时考虑了时滞效应对系统输出产生的影响,且时滞项不是固定值,从而更精确地拟合原始数据序列。ftdp-dgm(1,1)模型的建模步骤如图1所示。
[0038]
具体引用的概念和技术细节如下:
[0039]
ftdp-dgm(1,1)模型的构建与求解
[0040]
定义1:假设原始非负序列x
(0)
=(x
(0)
(1),x
(0)
(2),...,x
(0)
(n))和x
(r)
=(x
(r)
(1),x
(r)
(2),...,x
(r)
(n))为x
(0)
的r阶累加生成序列,则分数阶时滞多项式离散灰色预测模型的基本方程为:
[0041][0042]
称非线性参数a、b、c和d皆为分数阶时滞多项式离散灰色预测模型的结构参数,非线性参数r为分数阶时滞多项式离散灰色预测模型的累加阶数,取任意实数;τ为系统延迟时间,τ=1,2,...,k.
[0043]
定理1:ftdp-dgm(1,1)模型的时间响应式为:
[0044][0045]
证明:利用数学归纳法给出证明:
[0046]
当k=2时,分数阶时滞多项式离散灰色预测模型的基本方程变为:
[0047][0048]
当k=3时,分数阶时滞多项式离散灰色预测模型的基本方程变为:
[0049][0050]
当k=p∈n,且p>2时,有:
[0051][0052]
则,分数阶时滞多项式离散灰色预测模型的时间响应式的最后形式表示为:
[0053][0054]
确定分数阶时滞多项式离散灰色预测模型的时间响应式的最后形式后,还需进行数据模拟和仿真,判断是否满足模拟精度要求,具体的,满足模拟精度要求的判断条件具体为:
[0055]
[0056][0057][0058]
其中,所述rmse、mae和mape模型的值与模型的精度成反比;当mape大于10%时,不满足模拟精度要求。当不满足模拟精度要求时,需进行数据清洗,并回到初始步骤,直至满足模拟精度要求,并输出预测值。
[0059]
数据清洗步骤具体通过下式表示:
[0060][0061]
相比传统的fgm(1,1)模型,ftdp-dgm(1,1)模型考虑了时滞效应对系统输出的影响。时滞项可根据数据序列个数的变化而变化,从而提高了模型的拟合预测能力。此外,该模型的结构参数和时间响应式都是基于微分方程计算的,避免了传统灰色模型由连续过渡到离散产生的跳跃性误差。
[0062]
fgm(1,1)模型通过选取特定的参数值可以退化为现有的灰色模型。当r=1,b=0,c=0时,模型退化为x
(1)
(k)=ax
(1)
(k-1)+d,即离散灰色模型(dgm(1,1)模型);当r=0,b=0,c=0时,模型退化为x
(0)
(k)=ax
(0)
(k-1)+d,即直接离散灰色模型(ddgm(1,1)模型);当r=1,b=0,τ=k时,模型退化为x
(1)
(k)=ax
(1)
(k-1)+ck+d,即非齐次离散灰色模型(ndgm(1,1)模型);当b=0,c=0时,模型退化为x
(r)
(k)=ax
(r)
(k-1)+d,即分数阶离散灰色模型(fdgm(1,1)模型)。
[0063]
ftdp-dgm(1,1)模型的参数估计
[0064]
定理:ftdp-dgm(1,1)模型的参数列p=(a,b,c,d)
t
在最小二乘准则中满足p=(a,b,c,d)
t
=(b
t
b)-1bt
y,其中b表示为:
[0065][0066]
证明:将原始数据代入分数阶时滞多项式离散灰色预测模型的基本方程,得:
[0067][0068]
以上方程组可以写为矩阵y=bp,其中b为(n-1)
×
4矩阵。由于n≥4,则b为列满秩,在最小二乘准则下b表达式成立。
[0069]
由于分数阶r与最终的误差之间存在复杂的非线性关系,因此本发明以平均绝对百分比误差作为优化目标函数,利用遗传算法搜索的最优值。这种方法将误差作为优化目
标函数,实现了建模过程与模型检验的一致性,能够有效提升建模精度。优化目标函数即适应度函数为:
[0070][0071][0072]
其中,x
(0)
(i)为实际值;为预测值。
[0073]
实施例一:基于ftdp-dgm(1,1)模型的清洁能源发电量预测
[0074]
数据选取与说明
[0075]
选取我国2011—2012年风力、水力和核能发电量作为实验数据,数据均从英国石油公司2020年世界能源统计年鉴(http://www.bp.com/statisticalreview)中获取。从图2中可以看出,我国风力、水力和核能发电量持续上升,但呈现出随机波动的特征,存在显著的非线性特点。
[0076]
建模与求解
[0077]
为测试ftdp-dgm(1,1)模型的优越性,同时建立gm(1,1)模型、dgm(1,1)模型、fgm(1,1)模型与ftdp-dgm(1,1)模型进行对比分析,这三种对比模型对于我国三种主要清洁能源的模拟预测结果及误差如表1、表2和表3所示。
[0078]
分别以我国水力、风力和核能发电量作为实验数据,建立ftdp-dgm(1,1)模型。以mape为优化目标函数构建适应度函数,利用遗传算法搜索r的最优值分别为3.89、3.63和0.42,进一步可求得模型的最优结构参数,最后得出对应的时间响应式,并计算出ftdp-dgm(1,1)模型对于三种主要清洁能源的模拟预测结果及误差分别如表1、表2和表3所示。
[0079]
[0080][0081]
表1:不同模型对于水力发电量的预测结果及误差(单位:kwh)
[0082][0083]
表2:不同模型对于风力发电量的预测结果及误差(单位:kwh)
[0084]
[0085][0086]
表3:不同模型对于核能发电量的预测结果及误差(单位:kwh)
[0087]
由表1可以看出,ftdp-dgm(1,1)的模拟和预测误差均为最小,训练集和测试集的mape分别为2.07%和1.41%,说明本文模型具有最佳的模拟和预测性能。ftdp-dgm(1,1)模型的模拟和预测误差均比gm(1,1)模型小,表明分数阶的引入可以有效提高模型的预测精度。而gm(1,1)模型的预测误差比dgm(1,1)模型偏大,模拟误差比dgm(1,1)模型偏小,两者的性能相差不多,且均比ftdp-dgm(1,1)模型和fgm(1,1)模型大。因此,本文提出的ftdp-dgm(1,1)模型的预测精度要显著优于其他模型,这也表明,使用ftdp-dgm(1,1)模型对我国未来风力发电量进行宏观预测比使用其他灰色预测模型更为准确。
[0088]
由表2可以看出,dgm(1,1)模型的模拟误差相比ftdp-dgm(1,1)模型偏小,但预测误差为四种模型中最大,其中mape为15.48%。尽管gm(1,1)、dgm(1,1)和fgm(1,1)模型的模拟误差均很小,但它们的预测误差都超过10%,说明这三种灰色模型具有较强的拟合能力,而预测效果较差。ftdp-dgm(1,1)模型的模拟误差与其余三种模型相差不多,且预测误差最小,说明该模型具有良好的模型和预测能力,且预测性能最佳。综上所述,ftdp-dgm(1,1)模型相对最优。
[0089]
由表3可以看出,ftdp-dgm(1,1)模型在训练集和测试集的所有评价指标都是最小,且mape均小于5%,说明本文模型具有较强的优越性。其次是fgm(1,1)模型,模拟和预测误差分别为2.28%和7.45%。虽然gm(1,1)和dgm(1,1)模型的模拟误差均很小,但它们的预测误差均超过10%,预测性能较差。因此,ftdp-dgm(1,1)模型具有最优的拟合和预测效果。
[0090]
实施例总结
[0091]
基于以上三个实际案例研究可以发现,gm(1,1)、dgm(1,1)和fgm(1,1)模型对模拟和预测清洁能源发电量的效果不理想。ftdp-dgm(1,1)模型的预测效果比fgm(1,1)模型好,表明时滞效应对系统输出具有较大的影响。
[0092]
ftdp-dgm(1,1)模型的时间响应函数和结构参数由同一个方程求解,避免了传统灰色模型的跳跃性误差,进一步提高了预测性能。此外,利用遗传算法求解该模型中的非线性参数,不仅提高了ftdp-dgm(1,1)型的泛化能力,而且提高了模型的预测精度。综上所述,本发明提出的模型具有较强的优越性,可以适用于随机波动的非线性时间数据序列。
[0093]
以上仅为本发明的优选实施例而已,并不对本发明起到任何限制作用。任何所属技术领域的技术人员,在不脱离本发明的技术方案的范围内,对本发明揭露的技术方案和技术内容做任何形式的等同替换或修改等变动,均属未脱离本发明的技术方案的内容,仍属于本发明的保护范围之内。
技术特征:
1.一种含时滞性和非线性小样本时间序列的建模预测方法,其特征在于,包括如下步骤:s1:获取原始数据,根据对预测问题的分析,完成对原始数据的处理;s2:构建带有待定系数的分数阶时滞多项式离散灰色预测模型的时间响应式;s3:采用遗传算法和最小二乘法分别确定所述分数阶时滞多项式离散灰色预测模型中的最优非线性参数和结构参数;s4:确定分数阶时滞多项式离散灰色预测模型的时间响应式的最后形式;s5:进行数据模拟和仿真,判断是否满足模拟精度要求,当不满足模拟精度要求时,进行数据清洗,并重复s1-s5,直至满足精度要求,完成预测。2.根据权利要求1所述的含时滞性和非线性小样本时间序列的建模预测方法,其特征在于,所述s1中,设定原始非负序列x
(0)
=(x
(0)
(1),x
(0)
(2),...,x
(0)
(n))和x
(r)
=(x
(r)
(1),x
(r)
(2),...,x
(r)
(n))为x
(0)
的r阶累加生成序列。3.根据权利要求2所述的含时滞性和非线性小样本时间序列的建模预测方法,其特征在于,所述s2中,基于所述s1中的r阶累加生成序列,所述分数阶时滞多项式离散灰色预测模型的基本方程表示为:所述分数阶时滞多项式离散灰色预测模型的基本方程中,非线性参数a、b、c和d皆为分数阶时滞多项式离散灰色预测模型的结构参数;非线性参数r为分数阶时滞多项式离散灰色预测模型的累加阶数,取任意实数;τ为系统延迟时间,τ=1,2,...,k,则所述分数阶时滞多项式离散灰色预测模型的时间响应式为:4.根据权利要求2所述的含时滞性和非线性小样本时间序列的建模预测方法,其特征在于,所述s3中,所述最小二乘法具体为:所述分数阶时滞多项式离散灰色预测模型的参数列p=(a,b,c,d)
t
在最小二乘准则中满足p=(a,b,c,d)
t
=(b
t
b)-1
b
t
y,其中b表示为:5.根据权利要求2所述的含时滞性和非线性小样本时间序列的建模预测方法,其特征在于,所述s3中,所述遗传算法具体为:针对分数阶r和最终的误差之间存在复杂的非线性关系,采用平均绝对百分比误差作为优化目标函数,并利用遗传算法搜索r的最优值,所述优化目标函数表示为:
所述优化目标函数中,x
(0)
(i)为实际值;为预测值。6.根据权利要求2所述的含时滞性和非线性小样本时间序列的建模预测方法,其特征在于,所述s4中,所述分数阶时滞多项式离散灰色预测模型的时间响应式的最后形式具体为:当k=p∈n,且p>2时,则分数阶时滞多项式离散灰色预测模型的时间响应式的最后形式表示为:7.根据权利要求2所述的含时滞性和非线性小样本时间序列的建模预测方法,其特征在于,所述s5中,所述数据清洗具体为:满足模拟精度要求的判断条件具体为:满足模拟精度要求的判断条件具体为:满足模拟精度要求的判断条件具体为:其中,所述rmse、mae和mape模型的值与模型的精度成反比;当mape大于10%时,不满足模拟精度要求。
技术总结
本发明提供一种含时滞性和非线性小样本时间序列的建模预测方法,属于预测算法技术领域,该方法针对含时滞性和非线性小样本时间序列的建模预测问题,提出一种新的分数阶时滞多项式离散灰色预测模型,即FTDP-DGM(1,1)模型。包括有:利用数学归纳法推导该模型的时间响应式以及采用遗传算法确定模型中的最优非线性参数;本发明考虑了时滞效应对灰色系统的影响,避免了传统灰色模型存在的跳跃性误差,进一步提高了模型精度。该方法在水力、风力和核能发电量的模拟和预测结果中显示出有效性和实用性。实用性。实用性。
技术研发人员:刘斌
受保护的技术使用者:上海理工大学
技术研发日:2023.05.29
技术公布日:2023/8/13
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/