变电站工程成本预测的方法、装置、终端及存储介质与流程
未命名
09-12
阅读:77
评论:0

1.本发明涉及变电站规划技术领域,尤其涉及一种变电站工程成本预测的方法、装置、终端及存储介质。
背景技术:
2.变电站是我国电力系统中的重要中转设备,变电站工程是电网建设的主要内容之一。
3.在变电站项目规划和实施阶段通常需要对变电站项目进行成本估算,从而确定原有规划方案是否合理,为变电站项目建设的优化决策提供支持。现有技术中,在变电站项目规划阶段,土建部分对于工程投资有很大影响,但是在可行性研究阶段,工程量信息不准确导致将这些数据带入预测模型,预测结果误差较大。且在预测不同的工程投资规模时,需要统计不同的工程信息,相较于构建模型,更改模型中的部分模块和参数,工作重复且工作量巨大。
技术实现要素:
4.本发明实施例提供了一种变电站工程成本预测的方法、装置、终端及存储介质,以解决现有技术中预测结果不准确且工作量大的问题。
5.第一方面,本发明实施例提供了一种变电站工程成本预测的方法,包括:
6.获取变电站的历史工程成本数据;
7.对所述历史工程成本数据进行聚类分析,根据聚类分析结果去除异常数据点,得到正常数据,并将所述正常数据划分为训练数据集和测试数据集;
8.采用改进的灰狼优化算法和所述训练数据集对lssvm模型进行训练,得到训练后的lssvm模型;
9.采用预测数据集对所述训练后的lssvm模型进行预测,得到目标lssvm模型;
10.获取待预测工程成本数据,并输入所述目标lssvm模型中,输出预测结果。
11.在一种可能的实现方式中,对所述历史工程成本数据进行聚类分析,根据聚类分析结果去除异常数据点,得到正常数据,包括:
12.采用改进的灰狼优化算法对所述历史工程成本数据进行聚类分析,输出聚类信息;
13.将远离聚类信息中聚类中心预设距离的历史工程成本数据作为异常数据点,删除所有异常数据点后得到正常数据。
14.在一种可能的实现方式中,所述采用改进的灰狼优化算法对所述历史工程成本数据进行聚类分析,输出聚类信息,包括:
15.设置聚类中心数目,初始化聚类中心位置,将初始化的聚类中心位置作为灰狼初始位置,并初始化最大迭代次数、当前的迭代次数、收敛因子和系数向量;
16.将所述历史工程成本数据随机归入某一聚类中心位置,计算每个种群的适应度
值,根据所述适应度值,确定狼群中的α狼、β狼和δ狼;
17.除α狼、β狼和δ狼之外的狼对猎物进行围攻,更新所有灰狼的位置、收敛因子和系数向量;
18.按照最近邻法则对每个历史工程成本数据进行聚类划分,计算新的聚类中心位置和灰狼的新适应度值,并根据新的适应度值,更新狼群中的α狼、β狼和δ狼的适应度值和位置,将当前迭代次数加1;
19.检测更新后的迭代次数是否为最大迭代次数;
20.当更新后的迭代次数为最大迭代次数时,输出聚类信息;
21.当更新后的迭代次数不是最大迭代次数时,跳转到“除α狼、β狼和δ狼之外的狼对猎物进行围攻,更新所有灰狼的位置、收敛因子和系数向量”步骤执行。
22.在一种可能的实现方式中,初始化聚类中心位置,包括:
23.根据初始化聚类中心位置;
24.其中,x(t)表示聚类中心的位置向量,t表示迭代次数。
25.在一种可能的实现方式中,更新收敛因子,包括:
26.根据更新收敛因子;
27.其中,a表示更新后的收敛因子,a
ini
表示非线性因子的初始值,a
final
表示非线性因子的最终值,μ表示第一调整参数,λ表示第二调整参数,t
max
表示最大迭代次数。
28.在一种可能的实现方式中,所述采用改进的灰狼优化算法和所述训练数据集对lssvm模型进行训练,得到训练后的lssvm模型,包括:
29.初始化参数,所述参数包括:每个灰狼的位置、最大迭代次数、当前的迭代次数、收敛因子和系数向量;
30.将所述训练数据集中的数据依次输入自适应函数,计算每个种群的适应度值,根据所述适应度值,确定狼群中的α狼、β狼和δ狼;所述自适应函数为lssvm模型的输出值与实际值的均方根误差函数;
31.除α狼、β狼和δ狼之外的狼对猎物进行围攻,更新灰狼的位置、收敛因子和系数向量;
32.根据更新后的灰狼的位置、收敛因子和系数向量,计算灰狼的适应度值,并根据所述适应度值更新α狼、β狼和δ狼的适应度值和位置,且在当前迭代次数的基础上加一;
33.检测更新后的迭代次数是否为最大迭代次数,若更新后的迭代次数不是最大迭代次数时,跳转到“除α狼、β狼和δ狼之外的狼对猎物进行围攻,更新灰狼的位置、收敛因子和系数向量”步骤继续执行;若更新后的迭代次数是最大迭代次数时,得到训练后的lssvm模型,并输出lssvm模型的最优参数。
34.在一种可能的实现方式中,所述lssvm模型为
[0035][0036]
其中,xi表示第i样本的输入量,xj表示第j样本的输入量,i=1,2,
…
n,αi表示拉格朗日乘子,b表示偏差值,γ表示用于确定模型复杂度和精度之间权衡的正则化参数,ei表示实际值和输出值之间的回归误差,k(
·
)表示核函数,σ表示核参数。
[0037]
第二方面,本发明实施例提供了一种变电站工程成本预测的装置,包括:
[0038]
获取模块,用于获取变电站的历史工程成本数据;
[0039]
预处理模块,用于对所述历史工程成本数据进行聚类分析,根据聚类分析结果去除异常数据点,得到正常数据,并将所述正常数据划分为训练数据集和测试数据集;
[0040]
模型训练模块,用于采用改进的灰狼优化算法和所述训练数据集对lssvm模型进行训练,得到训练后的lssvm模型;
[0041]
所述模型训练模块,还用于采用预测数据集对所述训练后的lssvm模型进行预测,得到目标lssvm模型;
[0042]
预测模块,用于获取待预测工程成本数据,并输入所述目标lssvm模型中,输出预测结果。
[0043]
第三方面,本发明实施例提供了一种终端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上第一方面或第一方面的任一种可能的实现方式所述的变电站工程成本预测的方法的步骤。
[0044]
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上第一方面或第一方面的任一种可能的实现方式所述的变电站工程成本预测的方法的步骤。
[0045]
本发明实施例提供一种变电站工程成本预测的方法、装置、终端及存储介质,通过获取变电站的历史工程成本数据;对历史工程成本数据进行聚类分析,根据聚类分析结果去除异常数据点,得到正常数据,并将正常数据划分为训练数据集和测试数据集;采用改进的灰狼优化算法和训练数据集对lssvm模型进行训练,得到训练后的lssvm模型;采用预测数据集对训练后的lssvm模型进行预测,得到目标lssvm模型;获取待预测工程成本数据,并输入目标lssvm模型中,输出预测结果。本发明实施例通过对采集的历史工程成本数据进行聚类分析,从而剔除异常数据,得到正常数据,正常数据作为后续对lssvm模型的训练数据和验证数据,从而可以降低训练lssvm模型的时间,以及提高训练的lssvm模型的精度。
附图说明
[0046]
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些
实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0047]
图1是本发明实施例提供的一种变电站工程成本预测的方法的实现流程图;
[0048]
图2是本发明实施例提供的聚类分析的实现流程图;
[0049]
图3是本发明实施例提供的lssvm模型训练过程的实现流程图;
[0050]
图4是本发明实施例提供的一种变电站工程成本预测的装置的结构示意图;
[0051]
图5是本发明实施例提供的终端的示意图。
具体实施方式
[0052]
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
[0053]
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图通过具体实施例来进行说明。
[0054]
图1为本发明实施例提供的一种变电站工程成本预测的方法的实现流程图,详述如下:
[0055]
步骤101,获取变电站的历史工程成本数据。
[0056]
变电站的历史工程成本数据可以包括工程信息和电气信息,例如电压等级、主变压器的台数、单台容量等。
[0057]
在步骤102执行之前,还包括:对历史工程成本数据进行预处理,其中预处理包括对历史工程成本数据进行属性指标的单位化处理、属性指标的合并与删减以及数据的归一化处理,删除对工程造价影响较小的指标,完成预处理。
[0058]
步骤102,对历史工程成本数据进行聚类分析,根据聚类分析结果去除异常数据点,得到正常数据,并将正常数据划分为训练数据集和测试数据集。
[0059]
在一实施例中,对历史工程成本数据进行聚类分析,根据聚类分析结果去除异常数据点,得到正常数据,可以包括:
[0060]
采用改进的灰狼优化算法对历史工程成本数据进行聚类分析,输出聚类信息;
[0061]
将远离聚类信息中聚类中心预设距离的历史工程成本数据作为异常数据点,删除所有异常数据点后得到正常数据。
[0062]
参见图2所示,采用改进的灰狼优化算法对历史工程成本数据进行聚类分析,输出聚类信息,基于改进灰狼优化的聚类算法是最大化不同划分间距离的同时最小化划分内部的距离,将远离聚类中心的历史工程成本数据作为异常数据。
[0063]
可以包括如下步骤:
[0064]
步骤201,设置聚类中心数目,初始化聚类中心位置,将初始化的聚类中心位置作为灰狼初始位置,并初始化最大迭代次数、当前的迭代次数、收敛因子和系数向量。
[0065]
聚类中心数目可以根据需求进行设置,例如聚类中心数目可以为k个。
[0066]
在一实施例中,初始化聚类中心位置,可以包括:
[0067]
根据初始化聚类中心位置;
[0068]
其中,x(t)表示聚类中心的位置向量,也即灰狼的初始化位置,t表示迭代次数。
[0069]
现有技术中通常采用随机初始化的方式对灰狼的位置进行初始化,而本方案中采用基于tent混沌映射的方式进行初始化,可以降低现有技术中随机初始化的随机误差和人为经验误差,且可以提高历史工程成本数据的适用性,这是由于如果某个工程具有特殊性时,例如施工地点在市中心、火车站或者机场附近,则初始化位置向量不适用于一般地点,而采用基于tent混沌映射的方式进行初始化,则可以提高样本数据的适用性。
[0070]
步骤202,将历史工程成本数据随机归入某一聚类中心位置,计算每个种群的适应度值,根据适应度值,确定狼群中的α狼、β狼和δ狼。
[0071]
对于样本空间中的n个历史工程成本数据,每个历史工程成本数据为m维的数据,适应度值函数可以为
[0072][0073]
其中,jc表示所有历史工程成本数据到对应的划分中心的距离总和,zj表示第j个聚类的中心,k表示聚类中心数目,xi表示第i个历史工程成本数据,d(xi,zj)表示第i个历史工程成本数据到对应划分的聚类中心的距离。每个灰狼代表给定数目的聚类中心,粒子的位置和速度随着迭代次数的增加不断的更新,每个历史工程成本数据被划分到不同的划分中,直至达到停止条件。
[0074]
可选的,其中,x
im
表示数据空间中第i个历史工程成本数据中的第m个参数,z
jm
表示数据空间中第j个聚类的中心。
[0075]
计算得到适应度值之后,根据适应度值从大到小依次将狼群划分为α狼、β狼、δ狼和ω狼,整个狼群的捕食决策由α狼、β狼、δ狼三者决定,其余狼群负荷对猎物进行围攻。
[0076]
步骤203,除α狼、β狼和δ狼之外的狼对猎物进行围攻,更新所有灰狼的位置、收敛因子和系数向量。
[0077]
对猎物进行围攻阶段,
[0078]
其中,t表示当前迭代次数;d(
·
)表示狼群与猎物间的距离;x
p
表示猎物的位置向量,x为灰狼的位置向量;a与c是系数向量,定义为:
[0079][0080]
其中,a表示收敛因子,随着迭代次数的增加,a从2减少到0;r1和r2的取值范围为0~1;t
max
为总迭代次数。
[0081]
收敛因子采用线性调整时,容易过早陷入局部最优解,导致最优解不是最合适的解,因此在本实施例中收敛因子采用非线性调整策略,更新收敛因子,可以包括:
[0082]
根据更新收敛因子;
[0083]
其中,a表示更新后的收敛因子,a
ini
表示非线性因子的初始值,a
final
表示非线性因子的最终值,μ表示第一调整参数,λ表示第二调整参数,t
max
表示最大迭代次数。
[0084]
捕猎阶段,前3个等级的狼群即α狼、β狼和δ狼,寻找方向朝猎物逐渐靠近,该过程的数学表达式为:
[0085][0086]
其中,x
α
、x
β
和x
δ
分别为α狼、β狼和δ狼的最优位置;d
α
、d
β
和d
δ
分别为前3只最优狼与种群的距离。然后,在α狼、β狼和δ狼的领导下,更新灰狼种群的位置:
[0087][0088]
x
p
=(x1+x2+x3)/3
[0089]
其中,a1、a2、a3为由式a=2ar
1-a计算得到的不同系数;x1、x2、x3分别为α狼、β狼和δ狼领导下的更新位置。
[0090]
当a的值从2递减至0时,其对应的a的值也在区间[-a,a]中变化:a的取值越大则会使灰狼越远离猎物,希望找到一个更适合的猎物,因而促使狼群进行全局搜索(|a|》1,若a的取值越小则会使灰狼越靠近猎物,促使狼群进行局部搜索(|a|《1)。
[0091]
步骤204,按照最近邻法则对每个历史工程成本数据进行聚类划分,计算新的聚类中心位置和灰狼的新适应度值,并根据新的适应度值,更新狼群中的α狼、β狼和δ狼的适应度值和位置,将当前迭代次数加1。
[0092]
这里进行依次迭代,每次迭代需要重新计算适应度值,并根据适应度值重新更新α狼、β狼和δ狼的位置。
[0093]
步骤205,检测更新后的迭代次数是否为最大迭代次数。
[0094]
步骤206,当更新后的迭代次数为最大迭代次数时,输出聚类信息。
[0095]
当更新后的迭代次数为最大迭代次数时,表示流程结束,此时输出聚类中心,以及划分到各个聚类中心的历史工程成本数据。
[0096]
当更新后的迭代次数不是最大迭代次数时,跳转到“除α狼、β狼和δ狼之外的狼对猎物进行围攻,更新所有灰狼的位置、收敛因子和系数向量”步骤执行。
[0097]
当更新后的迭代次数不是最大迭代次数时,表示还需要继续进行下一次的迭代,重新围攻猎物,更新灰狼位置。
[0098]
将历史工程成本数据通过聚类的方式剔除异常数据,得到正常数据,这样可以提高后续模型的训练效率,且可以提高变电站工程成本预测的精确度。
[0099]
步骤103,采用改进的灰狼优化算法和训练数据集对lssvm模型进行训练,得到训练后的lssvm模型。
[0100]
本步骤中,改进的灰狼优化算法与上述进行聚类分析时采用的改进的灰狼优化算法相似,如图3所示,详述如下:
[0101]
步骤301,初始化参数,参数包括:每个灰狼的位置、最大迭代次数、当前的迭代次数、收敛因子和系数向量。
[0102]
这里初始化参数时,采用tent混沌映射的方法生成初始种群,即初始化每个灰狼的位置。
[0103]
可选的,根据初始化聚类中心位置;
[0104]
其中,x(t)表示聚类中心的位置向量,也即灰狼的初始化位置,t表示迭代次数。
[0105]
步骤302,将训练数据集中的数据输入自适应函数,计算每个种群的适应度值,根据适应度值,确定狼群中的α狼、β狼和δ狼;自适应函数为lssvm模型的输出值与实际值的均方根误差函数。
[0106]
在本实施例中,是对最小二乘支持向量机模型的参数进行优化,因此设置自适应函数为lssvm模型的输出值与实际值的均方根误差函数。
[0107]
可选的,lssvm模型为
[0108][0109]
其中,xi表示第i样本的输入量,xj表示第j样本的输入量,i=1,2,
…
n,αi表示拉格朗日乘子,b表示偏差值,γ表示用于确定模型复杂度和精度之间权衡的正则化参数,ei表示实际值和输出值之间的回归误差,k(
·
)表示核函数,在本实施例中选择抗干扰能力强以及参数设置少等优点的径向基rbf作为模型核函数,σ表示核参数。
[0110]
lssvm模型中的两个超参数γ和σ是对lssvm模型的性能影响很大的参数,采用改进灰狼优化算法对这两个参数进行优化,并且选择输出值与实际值的均方根误差作为模型的自适应函数值。
[0111]
步骤303,除α狼、β狼和δ狼之外的狼对猎物进行围攻,更新灰狼的位置、收敛因子和系数向量。
[0112]
本步骤与附图2中的步骤203相似,具体详述见步骤203,在本步骤中不再一一赘述。
[0113]
需要说明的是,更新收敛因子也是采用非线性调整策略,即
更新收敛因子。
[0114]
步骤304,根据更新后的灰狼的位置、收敛因子和系数向量,计算灰狼的适应度值,并根据适应度值更新α狼、β狼和δ狼的适应度值和位置,且在当前迭代次数的基础上加一。
[0115]
本步骤与附图2中的步骤204相似,具体详述见步骤204,在本步骤中不再一一赘述。
[0116]
步骤305,检测更新后的迭代次数是否为最大迭代次数;
[0117]
步骤306,若更新后的迭代次数不是最大迭代次数时,跳转到“除α狼、β狼和δ狼之外的狼对猎物进行围攻,更新灰狼的位置、收敛因子和系数向量”步骤继续执行;若更新后的迭代次数是最大迭代次数时,得到训练后的lssvm模型,并输出lssvm模型的最优参数。
[0118]
这里输出的最优参数即为最优超参数。
[0119]
步骤104,采用预测数据集对训练后的lssvm模型进行预测,得到目标lssvm模型。
[0120]
这里对训练后的lssvm模型进行预测,当预测结果与预设结果相差较大时,重新返回步骤103中对lssvm模型进行训练,训练完成后再执行步骤104,直到预测结构与预设结果的差值在一定范围内,说明lssvm模型训练成功,得到目标lssvm模型。
[0121]
步骤105,获取待预测工程成本数据,并输入目标lssvm模型中,输出预测结果。
[0122]
待测工程成本数据可以为在工程建议前采集的成本数据,可选的,可以在bim模型中获取工程成本信息,电气信息可以套用标准定额获取部分工程信息,该工程本身的特征指标可以包括电压等级、主变压器的台数、单台容量等指标。将这些工程信息整理,作为待预测工程成本,输入目标lssvm模型中,进而可以预测该工程的费用情况。
[0123]
本发明实施例通过获取变电站的历史工程成本数据;对历史工程成本数据进行聚类分析,根据聚类分析结果去除异常数据点,得到正常数据,并将正常数据划分为训练数据集和测试数据集;采用改进的灰狼优化算法和训练数据集对lssvm模型进行训练,得到训练后的lssvm模型;采用预测数据集对训练后的lssvm模型进行预测,得到目标lssvm模型;获取待预测工程成本数据,并输入目标lssvm模型中,输出预测结果。本发明实施例通过对采集的历史工程成本数据进行聚类分析,从而剔除异常数据,得到正常数据,正常数据作为后续对lssvm模型的训练数据和验证数据,从而可以降低训练lssvm模型的时间,以及提高训练的lssvm模型的精度。另外,在对历史工程成本数据进行聚类分析以及对lssvm模型进行训练时,采用改进的灰狼优化算法,其中采用tent混沌映射方法生成初始种群,可以降低随机初始化产生的误差,且对于特殊工程仍适用,适用性更广,采用非线性调整策略更新收敛因子,从而可以解决现有技术中采用线性方式更新收敛因子而很快陷入局部最后的情况,使得更快得到全局最优结果。
[0124]
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
[0125]
以下为本发明的装置实施例,对于其中未详尽描述的细节,可以参考上述对应的方法实施例。
[0126]
图4示出了本发明实施例提供的变电站工程成本预测的装置的结构示意图,为了
便于说明,仅示出了与本发明实施例相关的部分,详述如下:
[0127]
如图4所示,变电站工程成本预测的装置4包括:获取模块41、预处理模块42、模型训练模块43和预测模块44。
[0128]
获取模块41,用于获取变电站的历史工程成本数据;
[0129]
预处理模块42,用于对历史工程成本数据进行聚类分析,根据聚类分析结果去除异常数据点,得到正常数据,并将正常数据划分为训练数据集和测试数据集;
[0130]
模型训练模块43,用于采用改进的灰狼优化算法和训练数据集对lssvm模型进行训练,得到训练后的lssvm模型;
[0131]
模型训练模块43,还用于采用预测数据集对训练后的lssvm模型进行预测,得到目标lssvm模型;
[0132]
预测模块44,用于获取待预测工程成本数据,并输入目标lssvm模型中,输出预测结果。
[0133]
在一种可能的实现方式中,预处理模块42对历史工程成本数据进行聚类分析,根据聚类分析结果去除异常数据点,得到正常数据时,用于:
[0134]
采用改进的灰狼优化算法对历史工程成本数据进行聚类分析,输出聚类信息;
[0135]
将远离聚类信息中聚类中心预设距离的历史工程成本数据作为异常数据点,删除所有异常数据点后得到正常数据。
[0136]
在一种可能的实现方式中,预处理模块42采用改进的灰狼优化算法对历史工程成本数据进行聚类分析,输出聚类信息时,用于:
[0137]
设置聚类中心数目,初始化聚类中心位置,将初始化的聚类中心位置作为灰狼初始位置,并初始化最大迭代次数、当前的迭代次数、收敛因子和系数向量;
[0138]
将历史工程成本数据随机归入某一聚类中心位置,计算每个种群的适应度值,根据适应度值,确定狼群中的α狼、β狼和δ狼;
[0139]
除α狼、β狼和δ狼之外的狼对猎物进行围攻,更新所有灰狼的位置、收敛因子和系数向量;
[0140]
按照最近邻法则对每个历史工程成本数据进行聚类划分,计算新的聚类中心位置和灰狼的新适应度值,并根据新的适应度值,更新狼群中的α狼、β狼和δ狼的适应度值和位置,将当前迭代次数加1;
[0141]
检测更新后的迭代次数是否为最大迭代次数;
[0142]
当更新后的迭代次数为最大迭代次数时,输出聚类信息;
[0143]
当更新后的迭代次数不是最大迭代次数时,跳转到“除α狼、β狼和δ狼之外的狼对猎物进行围攻,更新所有灰狼的位置、收敛因子和系数向量”步骤执行。
[0144]
在一种可能的实现方式中,预处理模块42初始化聚类中心位置时,用于:
[0145]
根据初始化聚类中心位置;
[0146]
其中,x(t)表示聚类中心的位置向量,t表示迭代次数。
[0147]
在一种可能的实现方式中,预处理模块42更新收敛因子时,用于:
[0148]
根据更新收敛因子;
[0149]
其中,a表示更新后的收敛因子,a
ini
表示非线性因子的初始值,a
final
表示非线性因子的最终值,μ表示第一调整参数,λ表示第二调整参数,t
max
表示最大迭代次数。
[0150]
在一种可能的实现方式中,模型训练模块43采用改进的灰狼优化算法和训练数据集对lssvm模型进行训练,得到训练后的lssvm模型时,用于:
[0151]
初始化参数,参数包括:每个灰狼的位置、最大迭代次数、当前的迭代次数、收敛因子和系数向量;
[0152]
将训练数据集中的数据依次输入自适应函数,计算每个种群的适应度值,根据适应度值,确定狼群中的α狼、β狼和δ狼;自适应函数为lssvm模型的输出值与实际值的均方根误差函数;
[0153]
除α狼、β狼和δ狼之外的狼对猎物进行围攻,更新灰狼的位置、收敛因子和系数向量;
[0154]
根据更新后的灰狼的位置、收敛因子和系数向量,计算灰狼的适应度值,并根据适应度值更新α狼、β狼和δ狼的适应度值和位置,且在当前迭代次数的基础上加一;
[0155]
检测更新后的迭代次数是否为最大迭代次数,若更新后的迭代次数不是最大迭代次数时,跳转到“除α狼、β狼和δ狼之外的狼对猎物进行围攻,更新灰狼的位置、收敛因子和系数向量”步骤继续执行;若更新后的迭代次数是最大迭代次数时,得到训练后的lssvm模型,并输出lssvm模型的最优参数。
[0156]
在一种可能的实现方式中,lssvm模型为
[0157][0158]
其中xi表示第i样本的输入量,xj表示第j样本的输入量,i=1,2,
…
n,αi表示拉格朗日乘子,b表示偏差值,γ表示用于确定模型复杂度和精度之间权衡的正则化参数,ei表示实际值和输出值之间的回归误差,k(
·
)表示核函数,σ表示核参数。
[0159]
上述变电站工程成本预测的装置,通过获取模块获取变电站的历史工程成本数据;预处理模块对历史工程成本数据进行聚类分析,根据聚类分析结果去除异常数据点,得到正常数据,并将正常数据划分为训练数据集和测试数据集;模型训练模块采用改进的灰狼优化算法和训练数据集对lssvm模型进行训练,得到训练后的lssvm模型;模型训练模块采用预测数据集对训练后的lssvm模型进行预测,得到目标lssvm模型;预测模块获取待预测工程成本数据,并输入目标lssvm模型中,输出预测结果。本发明实施例通过对采集的历史工程成本数据进行聚类分析,从而剔除异常数据,得到正常数据,正常数据作为后续对lssvm模型的训练数据和验证数据,从而可以降低训练lssvm模型的时间,以及提高训练的
lssvm模型的精度。另外,在对历史工程成本数据进行聚类分析以及对lssvm模型进行训练时,采用改进的灰狼优化算法,其中采用tent混沌映射方法生成初始种群,可以降低随机初始化产生的误差,且对于特殊工程仍适用,适用性更广,采用非线性调整策略更新收敛因子,从而可以解决现有技术中采用线性方式更新收敛因子而很快陷入局部最后的情况,使得更快得到全局最优结果。
[0160]
图5是本发明实施例提供的终端的示意图。如图5所示,该实施例的终端5包括:处理器50、存储器51以及存储在所述存储器51中并可在所述处理器50上运行的计算机程序52。所述处理器50执行所述计算机程序52时实现上述各个变电站工程成本预测的方法实施例中的步骤,例如图1所示的步骤101至步骤105。或者,所述处理器50执行所述计算机程序52时实现上述各装置实施例中各模块/单元的功能,例如图4所示模块/单元41至44的功能。
[0161]
示例性的,所述计算机程序52可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器51中,并由所述处理器50执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序52在所述终端5中的执行过程。例如,所述计算机程序52可以被分割成图4所示的模块/单元41至44。
[0162]
所述终端5可包括,但不仅限于,处理器50、存储器51。本领域技术人员可以理解,图5仅仅是终端5的示例,并不构成对终端5的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端还可以包括输入输出设备、网络接入设备、总线等。
[0163]
所称处理器50可以是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0164]
所述存储器51可以是所述终端5的内部存储单元,例如终端5的硬盘或内存。所述存储器51也可以是所述终端5的外部存储设备,例如所述终端5上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。进一步地,所述存储器51还可以既包括所述终端5的内部存储单元也包括外部存储设备。所述存储器51用于存储所述计算机程序以及所述终端所需的其他程序和数据。所述存储器51还可以用于暂时地存储已经输出或者将要输出的数据。
[0165]
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本技术的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0166]
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
[0167]
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
[0168]
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
[0169]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0170]
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0171]
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个变电站工程成本预测的方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、电载波信号、电信信号以及软件分发介质等。
[0172]
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
技术特征:
1.一种变电站工程成本预测的方法,其特征在于,包括:获取变电站的历史工程成本数据;对所述历史工程成本数据进行聚类分析,根据聚类分析结果去除异常数据点,得到正常数据,并将所述正常数据划分为训练数据集和测试数据集;采用改进的灰狼优化算法和所述训练数据集对lssvm模型进行训练,得到训练后的lssvm模型;采用预测数据集对所述训练后的lssvm模型进行预测,得到目标lssvm模型;获取待预测工程成本数据,并输入所述目标lssvm模型中,输出预测结果。2.根据权利要求1所述的变电站工程成本预测的方法,其特征在于,对所述历史工程成本数据进行聚类分析,根据聚类分析结果去除异常数据点,得到正常数据,包括:采用改进的灰狼优化算法对所述历史工程成本数据进行聚类分析,输出聚类信息;将远离聚类信息中聚类中心预设距离的历史工程成本数据作为异常数据点,删除所有异常数据点后得到正常数据。3.根据权利要求2所述的变电站工程成本预测的方法,其特征在于,所述采用改进的灰狼优化算法对所述历史工程成本数据进行聚类分析,输出聚类信息,包括:设置聚类中心数目,初始化聚类中心位置,将初始化的聚类中心位置作为灰狼初始位置,并初始化最大迭代次数、当前的迭代次数、收敛因子和系数向量;将所述历史工程成本数据随机归入某一聚类中心位置,计算每个种群的适应度值,根据所述适应度值,确定狼群中的α狼、β狼和δ狼;除α狼、β狼和δ狼之外的狼对猎物进行围攻,更新所有灰狼的位置、收敛因子和系数向量;按照最近邻法则对每个历史工程成本数据进行聚类划分,计算新的聚类中心位置和灰狼的新适应度值,并根据新的适应度值,更新狼群中的α狼、β狼和δ狼的适应度值和位置,将当前迭代次数加1;检测更新后的迭代次数是否为最大迭代次数;当更新后的迭代次数为最大迭代次数时,输出聚类信息;当更新后的迭代次数不是最大迭代次数时,跳转到“除α狼、β狼和δ狼之外的狼对猎物进行围攻,更新所有灰狼的位置、收敛因子和系数向量”步骤执行。4.根据权利要求3所述的变电站工程成本预测的方法,其特征在于,初始化聚类中心位置,包括:根据初始化聚类中心位置;其中,x(t)表示聚类中心的位置向量,t表示迭代次数。5.根据权利要求3所述的变电站工程成本预测的方法,其特征在于,更新收敛因子,包括:根据更新收敛因子;
其中,a表示更新后的收敛因子,a
ini
表示非线性因子的初始值,a
final
表示非线性因子的最终值,μ表示第一调整参数,λ表示第二调整参数,t
max
表示最大迭代次数。6.根据权利要求1-5中任一项所述的变电站工程成本预测的方法,其特征在于,所述采用改进的灰狼优化算法和所述训练数据集对lssvm模型进行训练,得到训练后的lssvm模型,包括:初始化参数,所述参数包括:每个灰狼的位置、最大迭代次数、当前的迭代次数、收敛因子和系数向量;将所述训练数据集中的数据依次输入自适应函数,计算每个种群的适应度值,根据所述适应度值,确定狼群中的α狼、β狼和δ狼;所述自适应函数为lssvm模型的输出值与实际值的均方根误差函数;除α狼、β狼和δ狼之外的狼对猎物进行围攻,更新灰狼的位置、收敛因子和系数向量;根据更新后的灰狼的位置、收敛因子和系数向量,计算灰狼的适应度值,并根据所述适应度值更新α狼、β狼和δ狼的适应度值和位置,且在当前迭代次数的基础上加一;检测更新后的迭代次数是否为最大迭代次数,若更新后的迭代次数不是最大迭代次数时,跳转到“除α狼、β狼和δ狼之外的狼对猎物进行围攻,更新灰狼的位置、收敛因子和系数向量”步骤继续执行;若更新后的迭代次数是最大迭代次数时,得到训练后的lssvm模型,并输出lssvm模型的最优参数。7.根据权利要求6所述的变电站工程成本预测的方法,其特征在于,所述lssvm模型为其中,x
i
表示第i样本的输入量,x
j
表示第j样本的输入量,i,j=1,2,
…
n,α
i
表示拉格朗日乘子,b表示偏差值,γ表示用于确定模型复杂度和精度之间权衡的正则化参数,e
i
表示实际值和输出值之间的回归误差,k(
·
)表示核函数,σ表示核参数。8.一种变电站工程成本预测的装置,其特征在于,包括:获取模块,用于获取变电站的历史工程成本数据;预处理模块,用于对所述历史工程成本数据进行聚类分析,根据聚类分析结果去除异常数据点,得到正常数据,并将所述正常数据划分为训练数据集和测试数据集;模型训练模块,用于采用改进的灰狼优化算法和所述训练数据集对lssvm模型进行训练,得到训练后的lssvm模型;所述模型训练模块,还用于采用预测数据集对所述训练后的lssvm模型进行预测,得到目标lssvm模型;预测模块,用于获取待预测工程成本数据,并输入所述目标lssvm模型中,输出预测结果。9.一种终端,包括存储器和处理器,所述存储器用于存储计算机程序,所述处理器用于
调用并运行所述存储器中存储的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如上的权利要求1至7中任一项所述的方法的步骤。10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上的权利要求1至7中任一项所述的方法的步骤。
技术总结
本发明提供一种变电站工程成本预测的方法、装置、终端及存储介质。该方法包括:对获取的历史工程成本数据进行聚类分析,根据聚类分析结果去除异常数据点,将得到的正常数据划分为训练数据集和测试数据集;采用改进的灰狼优化算法和训练数据集对LSSVM模型进行训练;采用预测数据集对训练后的LSSVM模型进行预测,得到目标LSSVM模型;获取待预测工程成本数据,输入目标LSSVM模型中,输出预测结果。本发明能够通过对采集的历史工程成本数据进行聚类分析,剔除异常数据,得到正常数据,正常数据作为后续对LSSVM模型的训练数据和验证数据,从而可以降低训练LSSVM模型的时间,以及提高训练的LSSVM模型的精度。的LSSVM模型的精度。的LSSVM模型的精度。
技术研发人员:王松松 王江林 申哲巍 王磊 郭文培 乔文轩 李正晹 张怡 卞莉
受保护的技术使用者:上海电力设计院有限公司
技术研发日:2023.06.12
技术公布日:2023/9/9
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/