一种碳排放测算模型自适应优化更新方法及装置与流程
未命名
08-17
阅读:257
评论:0

1.本发明涉及一种更新方法及其装置,尤其是涉及一种碳排放测算模型自适应优化更新方法及装置,属于数据统计与测算技术领域。
背景技术:
2.传统的对抗生成网络(gan):gan由2个网络构成,分别是生成网络和判别网络。生成网络g:基于训练集的数据,对其概率分布持续进行学习,从而把提供给该网络的随机噪声数据转变成足以以假乱真的数据。图1表明,生成网络接收到噪声数据,然后输出数据给判别网络d。
3.判别网络d:能够识别数据的真实性,在整个对抗网络中,其作用是把生成网络g形成的“假”数据和来自训练集的“真”数据区分开来。如图1中所示,判别网络d接收生成网络g送过来的假数据进行一个二分类的判定。当生成网络g产生的数据足够逼真时,判别网络就判定为真,此时生成网络就可以制造试验数据。
4.arima模型建模步骤
5.1)首先对序列进行零均值化处理和差分平稳化处理,消除序列的季节性,以便预处理之后的数据满足模型建立的条件,使得预测结果更加准确。
6.2)通过自相关分析函数acf(auto correlation)和偏自相关函数pacf(partial auto correlation function,确定模型的阶数p、q、d。再从ar(p)、ma(q)、arma(p,q)和arima(p,q)模型中选择一个最匹配的模型建模。
[0007][0008]
其中,y
t
代表不同样本的值;ε
t
为服从正态分布的白噪声序列;和θi(i=1,2,
…
,q)分别为自回归系数、移动平均系数。p、d、q分别为arima(p,d,q)模型的自回归阶数、平稳处理时的差分次数、移动平均阶数。
[0009]
3)通过求解方程的方式来确定模型的参数值。
[0010]
4)对模型的残差序列进行检验,判断该序列是否自相关、是否满足白噪声,若检验不能通过,则返回步骤2重新构建模型直到通过检验。
[0011]
5)建模并得到预测模型,用于实际预测。
[0012]
然而,传统的对抗生成网络(gan)的缺点:存在训练不稳定、梯度消失、模式崩溃的问题。arima模型从时间序列自身出发,建立相应的模型进行分析,该方法计算简单、操作方便、定义了过去数据与现在数据的关系,但arima模型对于既有季节性又有长期趋势的时间序列,不足以提取其中的季节信息。
技术实现要素:
[0013]
为了解决现有技术中存在的缺陷,本发明采用了元学习的思想,通过在每个优化步骤中采样一小批任务和数据来更新生成模型和判别模型,使得模型能够更好地应对未知的碳排放情况,能够生成更多、更丰富、更真实的碳排放数据样本,提高数据的逼真性和可
靠性。为了能够对季节性组件建模,本发明还提出了季节性差分自回归滑动平均模型sarima模型。该方法在arima模型的基础上,充分考虑了周期性特征,并且使用外部信息来增强模型的预测能力,时间推理能力强。本法民技术方案如下:
[0014]
一种碳排放测算模型自适应优化更新方法,其特征为:
[0015]
步骤1,采用元对抗训练方式进行碳排放数据样本增强;
[0016]
步骤2,采用sarima模型进行非平稳碳排放时间序列计算;
[0017]
步骤3,采用自适应集成学习算法根据地区及行业环境特征对碳排放基模型权重进行自适应更新。
[0018]
本发明还公开一种碳排放测算模型自适应优化更新装置,其特征为:
[0019]
碳排放数据样本增强模块,该模块采用元对抗训练方式实现碳排放数据样本的增强;
[0020]
非平稳碳排放时间序列计算模块,采用sarima模型实现非平稳碳排放时间序列计算;
[0021]
自适应更新模块,采用自适应集成学习算法根据地区及行业环境特征对碳排放基模型权重实现自适应更新。
[0022]
本发明还公开一种非易失性存储介质,其特征在于,所述非易失性存储介质包括存储的程序,其中,所述程序运行时控制非易失性存储介质所在的设备执行上述方法。
[0023]
本发明还公开一种电子装置,其特征在于,包含处理器和存储器;所述存储器中存储有计算机可读指令,所述处理器用于运行所述计算机可读指令,其中,所述计算机可读指令运行时执行上述的方法。
[0024]
有益效果
[0025]
(1)采用了元学习的思想,通过在每个优化步骤中采样一小批任务和数据来更新生成模型和判别模型,使得模型能够更好地应对未知的碳排放情况,能够生成更多、更丰富、更真实的碳排放数据样本,提高数据的逼真性和可靠性。
[0026]
(2)为了能够对季节性组件建模,提出了季节性差分自回归滑动平均模型sarima模型。该方法在arima模型的基础上,充分考虑了周期性特征,并且使用外部信息来增强模型的预测能力,时间推理能力强。
[0027]
(3)本发明具有较高的实用性和经济效益,适用于各种碳排放数据分析、建模和预测等应用领域。
附图说明
[0028]
图1为现有技术对抗生成网络流程图;
[0029]
图2为本发明碳排放测算模型自适应优化更新方法流程图;
[0030]
图3为本发明sarima模型建模流程图;
[0031]
图4为本发明siel算法结构流程图。
具体实施方式
[0032]
下面我们先对本发明涉及的背景技术做一阐述以使本发明更加清楚公开充分。
[0033]
(1)对抗训练
[0034]
对抗训练是一种针对深度学习模型的训练方法,旨在提高模型对抗攻击的鲁棒性。对抗攻击是指故意制造一些特定的输入,使模型产生错误的输出。对抗训练的基本思想是在训练过程中引入对抗样本,这些对抗样本旨在欺骗模型并使其产生错误的输出。模型在训练中学习如何正确地识别这些对抗样本,从而提高了其鲁棒性。对抗训练可以通过不同的方法来实现,例如将对抗样本添加到训练数据中或在训练过程中使用生成对抗网络来生成对抗样本。对抗训练是一种用于提高模型安全性和鲁棒性的有效方法,已经被广泛应用于计算机视觉、自然语言处理等领域。
[0035]
对抗训练可以概括为如下的最大最小化公式:
[0036][0037]
内层(中括号内)x是一个最大化,其中δ表示样本的输入表示,f
θ
表示叠加在输入上的扰动,y是神经网络函数,l(f
θ
(x+δ),y)是样本的标签,则表示在样本x上叠加一个扰动δ,再经过神经网络函数,与标签y比较得到的损失。maxl是优化目标,即寻找使损失函数最大的扰动,简单来讲就是添加的扰动要尽量让神经网络迷惑。
[0038]
外层就是对神经网络进行优化的最小化公式,即当扰动固定的情况下,我们训练神经网络模型使得在训练数据上的损失最小,也就是说,使模型具有一定的鲁棒性能够适应这种扰动。
[0039]
(2)adf检验
[0040]
adf检验全称是augmented dickey-fuller test,顾名思义,adf是dickey-fuller检验的增广形式。df检验只能应用于一阶情况,当序列存在高阶的滞后相关时,可以使用adf检验,所以说adf是对df检验的扩展。adf检验就是判断序列是否存在单位根:如果序列平稳,就不存在单位根;否则,就会存在单位根。所以,adf检验的h0假设就是存在单位根,如果得到的显著性检验统计量小于三个置信度(10%,5%,1%),则对应有(90%,95,99%)的把握来拒绝原假设。检验的对象叫做单位根。当一个自回归过程中:如果滞后项系数b为1,就称为单位根。当单位根存在时,自变量和因变量之间的关系具有欺骗性,因为残差序列的任何误差都不会随着样本量(即时期数)增大而衰减,也就是说模型中的残差的影响是永久的。这种回归又称作伪回归。如果单位根存在,这个过程就是一个随机漫步(random walk)。
[0041]
(3)sarima模型
[0042]
arma模型是一种常用的随机时序模型,是时间序列模型中的经典模型,由美国统计学家box和英国统计学家jenkins创立,亦称b-j方法。
[0043]
1)自回归移动平均(arma)模型
[0044]
如果时间序列{y
t
}是它的当前和前期的随机误差项以及前期值的线性函数,则可表示为:
[0045]yt
=c+θ1y
t-1
+θ2y
t-2
+
…
+θ
pyt-p
+ε
t-φ1ε
t-1
‑…‑
φqε
t-q
ꢀꢀꢀꢀ
(2)
[0046]
称该时间序列{y
t
}为自回归移动平均序列,式(2)为(p,q)阶的自回归移动平均模型,记为arma(p,q)。c为常数项,实参数θ1,θ2,
…
,θ
p
称为自回归系数,φ1,φ2,
…
,φq称为移动平均系数,都是arma(p,q)模型的待估参数。
[0047]
引入滞后算子,则式(2)可简记为:θ(b)y
t
=c+φ(b)ε
t
[0048]
2)单整自回归移动平均(arima)模型
[0049]
如果时间序列{y
t
}的d阶差分x
t
=(1-b)dy
t
是一个平稳的arma(p,q)过程,其中d≥1是整数,则有:
[0050]
θ(b)(1-b)dy
t
=c+φ(b)ε
t
ꢀꢀꢀꢀꢀ
(3)
[0051]
称该时间序列{y
t
}为单整自回归移动平均序列,即式(3)为(p,d,q)阶的单整自回归移动平均模型,记为arima(p,d,q)。
[0052]
3)季节单整自回归移动平均(sarima)模型
[0053]
在一些时间序列中,存在明显的周期性变化,这种周期是由于季节性变化(包括季度、月度等变化)或者其他一些固有因素引起的,这类序列就称为季节性时间序列,季节时间序列模型(seasonal arima model),或者称为乘积季节模型(multiplicative seasonal model),便是处理这类时间序列的模型之一,记为sarima。
[0054]
设季节序列的变化周期为s,则一次季节差分可以表示为:(1-bs)y
t
=y
t-y
t-s
。对于非平稳时间序列,有时需要进行d阶季节差分之后才能转换为平稳序列。记p表示季节自回归最大滞后期,q表示季节移动平均最大滞后期,于是sarima模型的一般表达式可定义如下:
[0055]
θ
p
(b)λ
p
(bs)(1-b)d(1-bs)dy
t
=c+φq(b)ψq(bs)ε
t
ꢀꢀꢀꢀꢀꢀ
(4)
[0056]
称式(4)为(p,d,q)
×
(p,d,q)阶的季节时间序列模型或者乘积季节模型。如果含有时间趋势项,则可以定义如下模型:
[0057]
θ
p
(b)λ
p
(bs)(1-b)d(1-bs)dy
t
=c+βt+φq(b)ψq(bs)ε
t
ꢀꢀꢀꢀꢀ
(5)
[0058]
(4)集成学习
[0059]
集成学习是一种机器学习范式。在集成学习中,会训练多个模型(通常称为「弱学习器」)解决相同的问题,并将它们结合起来以获得更好的结果。最重要的假设是:当弱模型被正确组合时,可以得到更精确和/或更鲁棒的模型。在集成学习理论中,将弱学习器(或基础模型)称为「模型」,这些模型可用作设计更复杂模型的构件。在大多数情况下,这些基本模型本身的性能并不是非常好,这要么是因为它们具有较高的偏置(例如,低自由度模型),要么是因为它们的方差太大导致鲁棒性不强(例如,高自由度模型)。集成方法的思想是通过将这些弱学习器的偏置和/或方差结合起来,从而创建一个「强学习器」(或「集成模型」),从而获得更好的性能。
[0060]
(5)elmk训练
[0061]
elmk训练是一种用于解决高维稀疏数据分类问题的方法。elmk代表的是extreme learning machine on random kernels,它是一种基于随机核的极限学习机方法。与传统的基于神经网络的分类方法不同,elmk训练使用的是固定的随机核函数,而不是需要对核函数进行优化的参数化核函数。这使得elmk训练更加高效,并且可以有效地处理高维稀疏数据。
[0062]
实施例1
[0063]
本发明公开一种碳排放测算模型自适应优化更新方法,其特征为:
[0064]
步骤1,采用元对抗训练方式进行碳排放数据样本增强。该步骤采用元对抗训练方式,通过对初始碳排放数据样本进行变形生成一批合成碳排放数据样本,并训练生成模型和判别模型,不断交替优化生成模型和判别模型,使得生成的合成碳排放数据样本越来越接近真实数据样本,从而生成更多的、更丰富的、更真实的碳排放数据样本。具体内容如下:
[0065]
s1:选择一批初始碳排放数据样本:选择一批初始碳排放数据样本,可以从已有的数据集中随机选择或者根据特定的策略选择。
[0066]
s2:对所选初始碳排放数据样本进行变形生成一批合成碳排放数据样本:对所选初始碳排放数据样本采用随机变换、数据插值等方式进行变形,生成一批与真实数据样本具有一定相似性的合成碳排放数据样本。
[0067]
s3:训练一个生成模型,通过对合成碳排放数据样本的生成来优化该模型:通过采用gan、vae等方法训练一个生成模型,通过对合成碳排放数据样本的生成来优化该模型。
[0068]
s4:训练一个判别模型,通过对真实碳排放数据样本和合成碳排放数据样本的判别来优化该模型:采用传统的分类模型训练一个判别模型,通过对真实碳排放数据样本和合成碳排放数据样本的判别来优化该模型。
[0069]
s5:在训练过程中,反复交替优化生成模型和判别模型,直到生成模型生成的合成碳排放数据样本无法被判别模型准确区分为真实碳排放数据样本:在训练过程中,反复交替优化生成模型和判别模型,直到生成模型生成的合成碳排放数据样本无法被判别模型准确区分为真实碳排放数据样本,使得生成的合成碳排放数据样本越来越接近真实数据样本。
[0070]
s6:将生成模型应用于生成新的碳排放数据样本:根据需要控制生成数据样本的数量和质量,将生成模型应用于生成新的碳排放数据样本,以满足不同的应用场景。
[0071]
步骤2,采用sarima模型进行非平稳碳排放时间序列计算;
[0072]
采用平均法或者移动平均趋势剔除法对碳排放时间序列数据进行分解;采用adf检验方法对非平稳碳排放时间序列数据集进行非平稳检验,对非平稳的数据进行差分,直到差分为平稳时间序列;对差分后的序列进行自相关检验,并引入自相关系数和偏自相关系数;利用残差检验判断模型是否可行,直到选择的模型通过并进行预测与分析。
[0073]
sarima模型是arima模型的一种变形,该模型主要针对具有季节性或周期性规律变化的时间序列。sarima模型在arima模型的基础上添加了3个新的超参数,以指定序列的季节性分量的自回归、微分和移动平均值,以及季节性周期的附加参数。sarima模型核心要点是对碳排放数据的处理,将拟合后的误差作为分析要素,充分考虑残差信息。
[0074]
sarima模型可表示为sarima(p,d,q)
×
(p,d,q)s,该模型在平稳化处理时除了使用差分还可以使用季节性差分。碳排放时间序列数据的sarima模型的数学表达式为
[0075][0076]
其中,参数p、q、d与在arima模型中的含义相同;参数p、q、d在p、q、d的基础上添加了季节性;y
t
表示时序值;b表示后移算子;s表示周期长度;表示序列的差分次数为d次,表示序列的季节性差分次数为d次;φ
p
(b)、φ
p
(bs)表示非季节性和季节性自回归分量,阶数为p;θq、θq(bs)表示非季节性和季节性移动平均分量,阶数为q;ε
t
表示零均值白噪声序列。sarima模型的构建过程如下:
[0077]
s1:采用移动平均趋势剔除法、平均法等方法对季节性碳排放时间序列数据进行分解,来最终确定s的值。
[0078]
s2:平稳性判断,对非平稳碳排放时间序列的数据进行差分,直到差分为平稳时间序列,在此过程中确定趋势差分阶数d与季节差分的阶数d。
[0079]
s3:对差分后的序列进行自相关检验,并引入自相关系数和偏自相关系数,将自相关和偏自相关函数可视化,通过可视化图形是拖尾还是截尾来确定p、q、p、q的值,或者使用网格搜索法,搜索最佳的参数配置。
[0080]
s4:参数估计与模型检验,利用残差检验判断模型是否可行,若可行则进行步骤s5,否则返回步骤s3,重新选择参数并再次进行残差检验,直到选择的模型通过残差检验。
[0081]
s5:确定最终模型并进行预测与分析。
[0082]
步骤3,采用自适应集成学习siel算法根据地区及行业环境特征对碳排放基模型权重进行自适应更新。
[0083]
根据得到的数据子集进行初始化分布,此时所有数据权重是相同的;计算集成模型在新的数据子集上的相对误差,根据相对误差结果更新数据权重,对最新的数据权重进行归一化处理;使用elmk训练一个新的基模型,将其作为新的集成成员来增量的构建基模型集合,评估基模型性能;计算所有基模型的加权平均误差以自适应的更新基模型权重消除环境特征对基模型的影响;使用加权规则组合每个基模型,得到一个新的集成模型,进而根据地区及行业环境特征对碳排放基模型权重进行自适应更新。
[0084]
自适应集成学习siel算法的具体步骤如下:
[0085]
1)使用式(7)对非平稳碳排放时间序列nsfts={d1,d2,
…
,dn}进行归一化处理,得到序列data。
[0086][0087]
式中:di表示原始数据,d
min
表示原序列上的最小值,d
max
表示原序列上的最大值,d
′i表示归一化后的数据。然后,将data转换为预测任务所需的训练集train={(x1,y1),(x2,y2),
…
,(xn,yn)}和测试集test={(x
n+1
,y
n+1
),(x
n+2
,y
n+2
),
…
,(x
n+ts
,y
n+ts
)},其中n=n-tw-ts,tw表示时间窗大小,ts表示测试集大小。然后把train分成t部分,得到其中
[0088]
(2)当新的数据子集dt到来时,初始化数据分布。此时,所有数据的权重是相同的,即siel算法的具体步骤如下:
[0089][0090]
(3)更新并归一化数据权重。首先,计算当前集成模型h
t-1
在d
t
上的相对误差
[0091][0092]
然后,根据e
t
更新数据权重
[0093][0094]
更新的数据权重不是为了数据采样,而是为了在式(14)中评估和均衡误差。最后,对w
t
(i)进行归一化处理,即
[0095][0096]
(4)在d
t
上使用elmk训练一个新的基模型h
t
,将其作为新的集成成员来增量地构建基模型集合。
[0097]
(5)评估此时所有基模型hk(k=1,2,
…
,t)在d
t
上的性能
[0098][0099]
对表现较差的模型进行处理:当重新训练一个h
t
;当令这样处理的目的一是保证集成模型中新成员的性能;二是使集成模型具有协调新旧知识以及应对重现环境的能力。
[0100]
(6)计算所有基模型的加权平均误差以自适应地更新基模型权重并消除噪声对基模型的影响。首先根据式(13~15)对基模型的误差进行时间加权,以便为每个基模型在更新数据集下的性能分配到更大的权重值,然后根据式(16)计算各个基模型的权重。
[0101][0102][0103][0104][0105]
(7)使用加权规则组合每个基模型,得到一个新的集成模型,即
[0106][0107]
这时,生成的集成模型h
t
将通过影响数据权重的更新来影响基模型权重的更新。理想情况下,只要数据输入不中断,siel算法将会始终生成新的集成模型来适应下一个新环境。
[0108]
本发明提出了一种新规则来自适应的更新数据权重和构建基模型,有助于提高最终模型的泛化性和鲁棒性,提高基模型的多样性。本发明在对抗训练过程中加入元学习方法,利用元学习在面对新出现的样本时具有较强的泛化性、较高的识别准确率的特点,解决对抗训练泛化性较差的问题;此外,本发明充分考虑了周期性特征,并且使用外部信息来增强模型的预测能力,时间推理能力强,使得碳排放时间序列计算结果更准确。
[0109]
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是本发明的原理,在不脱离本发明精神和范围的前提下本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明的范围内。本发明要求的保护范围由所附的权利要求书及其等同物界定。
技术特征:
1.一种碳排放测算模型自适应优化更新方法,其特征为:步骤1,采用元对抗训练方式进行碳排放数据样本增强;步骤2,采用sarima模型进行非平稳碳排放时间序列计算;步骤3,采用自适应集成学习siel算法根据地区及行业环境特征对碳排放基模型权重进行自适应更新。2.根据权利要求1所述的碳排放测算模型自适应优化更新方法,其特征为:采用所述元对抗训练方式,通过对初始碳排放数据样本进行变形生成一批合成碳排放数据样本,并训练生成模型和判别模型,不断交替优化生成模型和判别模型,使得生成的合成碳排放数据样本越来越接近真实数据样本,从而生成更多的、更丰富的、更真实的碳排放数据样本。3.根据权利要求1所述的碳排放测算模型自适应优化更新方法,其特征为:所述步骤1进一步包括如下内容:s1:选择一批初始碳排放数据样本;s2:对所选初始碳排放数据样本进行变形生成一批合成碳排放数据样本;s3:训练一个生成模型,通过对合成碳排放数据样本的生成来优化该模型;s4:训练一个判别模型,通过对真实碳排放数据样本和合成碳排放数据样本的判别来优化该模型;s5:在训练过程中,反复交替优化生成模型和判别模型,直到生成模型生成的合成碳排放数据样本无法被判别模型准确区分为真实碳排放数据样本;s6:将生成模型应用于生成新的碳排放数据样本。4.根据权利要求1所述的碳排放测算模型自适应优化更新方法,其特征为:采用平均法或者移动平均趋势剔除法对碳排放时间序列数据进行分解;采用adf检验方法对非平稳碳排放时间序列数据集进行非平稳检验,对非平稳的数据进行差分,直到差分为平稳时间序列;对差分后的序列进行自相关检验,并引入自相关系数和偏自相关系数;利用残差检验判断模型是否可行,直到选择的模型通过并进行预测与分析。5.根据权利要求1所述的碳排放测算模型自适应优化更新方法,其特征为:碳排放时间序列数据的sarima模型的数学表达式为其中,参数p、q、d分别为arima(p,d,q)模型的自回归阶数、平稳处理时的差分次数、移动平均阶数;参数p、q、d在p、q、d的基础上添加了季节性;y
t
表示时序值;b表示后移算子;s表示周期长度;表示序列的差分次数为d次,表示序列的季节性差分次数为d次;φ
p
(b)、φ
p
(b
s
)表示非季节性和季节性自回归分量,阶数为p;θ
q
、θ
q
(b
s
)表示非季节性和季节性移动平均分量,阶数为q;ε
t
表示零均值白噪声序列。6.根据权利要求5所述的碳排放测算模型自适应优化更新方法,其特征为:所述sarima模型构建过程如下:s1:采用移动平均趋势剔除法、平均法等方法对季节性碳排放时间序列数据进行分解,来最终确定s的值;s2:平稳性判断,对非平稳碳排放时间序列的数据进行差分,直到差分为平稳时间序列,在此过程中确定差分次数d与季节性差分的阶数d;
s3:对差分后的序列进行自相关检验,并引入自相关系数和偏自相关系数,将自相关和偏自相关函数可视化,通过可视化图形是拖尾还是截尾来确定p、q、p、q的值,或者使用网格搜索法,搜索最佳的参数配置,其中,q为阶数;s4:参数估计与模型检验,利用残差检验判断模型是否可行,若可行则进行步骤s5,否则返回步骤s3,重新选择参数并再次进行残差检验,直到选择的模型通过残差检验;s5:确定最终模型并进行预测与分析。7.根据权利要求1所述的碳排放测算模型自适应优化更新方法,其特征为:所述步骤3进一步内容如下:根据得到的时间序列数据样本进行初始化分布,此时所有数据权重是相同的;计算集成模型在新的数据子集上的相对误差,根据相对误差结果更新数据权重,对最新的数据权重进行归一化处理;使用elmk训练一个新的基模型,将其作为新的集成成员来增量的构建基模型集合,评估基模型性能;计算所有基模型的加权平均误差以自适应的更新基模型权重消除环境特征对基模型的影响;使用加权规则组合每个基模型,得到一个新的集成模型,进而根据地区及行业环境特征对碳排放基模型权重进行自适应更新。8.根据权利要求7所述的碳排放测算模型自适应优化更新方法,其特征为:所述siel算法的具体步骤如下:1)使用式(7)对非平稳碳排放时间序列nsfts={d1,d2,
…
,d
n
}进行归一化处理,得到序列data;式中:d
i
表示原始数据,d
min
表示原序列上的最小值,d
max
表示原序列上的最大值,d
′
i
表示归一化后的数据;将data转换为预测任务所需的训练集train={(x1,y1),(x2,y2),
…
,(x
n
,y
n
)}和测试集test={(x
n+1
,y
n+1
),(x
n+2
,y
n+2
),
…
,(x
n+ts
,y
n+ts
)},其中n=n-tw-ts,tw表示时间窗大小,ts表示测试集大小;把train分成t部分,得到d
t
={(x1,y1),(x2,y2),
…
,(x
mt
,y
mt
),t=1,2,
…
,t},其中(2)当新的数据子集d
t
到来时,初始化数据分布;此时,所有数据的权重是相同的,即(3)更新并归一化数据权重;首先,计算当前集成模型h
t-1
在d
t
上的相对误差其中,e
t
为集成模型的相对误差,abs(
·
)函数为取括号中数值的绝对值,然后,根据e
t
更新数据权重w
t
:对w
t
(i)进行归一化处理,即
(4)在d
t
上使用elmk训练一个新的基模型h
t
,将其作为新的集成成员来增量地构建基模型集合;(5)评估此时所有基模型h
k
(k=1,2,
…
,t)在d
t
上的性能:对表现较差的模型进行处理:当时,重新训练一个h
t
;当令这样处理的目的一是保证集成模型中新成员的性能;二是使集成模型具有协调新旧知识以及应对重现环境的能力;(6)计算所有基模型的加权平均误差以自适应地更新基模型权重并消除噪声对基模型的影响;(7)使用加权规则组合每个基模型,得到一个新的集成模型,即:这时,生成的集成模型h
t
将通过影响数据权重的更新来影响基模型权重的更新。9.一种碳排放测算模型自适应优化更新装置,其特征为:碳排放数据样本增强模块,该模块采用元对抗训练方式实现碳排放数据样本的增强;非平稳碳排放时间序列计算模块,采用sarima模型实现非平稳碳排放时间序列计算;自适应更新模块,采用自适应集成学习算法根据地区及行业环境特征对碳排放基模型权重实现自适应更新。10.一种电子装置,其特征在于,包含处理器和存储器;所述存储器中存储有计算机可读指令,所述处理器用于运行所述计算机可读指令,其中,所述计算机可读指令运行时执行权利要求1至7中任意一项所述的方法。
技术总结
本发明公开一种碳排放测算模型自适应优化更新方法及装置,属于数据统计与测算技术领域。该碳排放测算模型自适应优化更新方法包括:首先提出一种元对抗训练方式,通过对初始碳排放数据样本进行变形生成一批合成碳排放数据样本,并训练生成模型和判别模型来优化模型,进而进行样本增强;其次采用ADF检验方法对非平稳碳排放时间序列数据集进行非平稳检验,基于SARIMA模型进行非平稳碳排放时间序列计算;最后采用自适应集成学习算法训练一个新的碳排放基模型,并根据地区及行业环境特征碳排放基模型权重进行自适应更新。放基模型权重进行自适应更新。放基模型权重进行自适应更新。
技术研发人员:杨维 袁启恒 周春雷 李燕溪 徐科 陈翔 宋金伟 史昕 李晓燕 张世泽
受保护的技术使用者:国家电网有限公司大数据中心
技术研发日:2023.06.09
技术公布日:2023/8/16
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/