一种基于EO特征选择结合AdaBoost算法的工业电力负荷辨识方法
未命名
08-14
阅读:100
评论:0

一种基于eo特征选择结合adaboost算法的工业电力负荷辨识方法
技术领域
1.本发明涉及工业电力负荷辨识领域,具体是一种基于eo特征选择结合adaboost算法的工业电力负荷辨识方法。
背景技术:
2.能源是人类社会发展的重要基础,也是经济增长和生活质量的关键因素。在能源消耗中,电能占有很大的比重,反映了一个国家或地区的工业化水平和科技创新能力。工业用电作为电能消耗的主要部分,直接影响着工业生产效率和质量,更涉及环境保护和节能减排。因此,提高工业用电效率,优化工业用电结构,是促进经济社会可持续发展的重要途径。对工业用电场景进行电力负荷辨识的研究有助于优化设备配置和调度策略,降低无效功率和损耗,提高能源利用率,实现智能能源管理。
3.工业电力负荷辨识是指利用电力系统的测量数据,对工业用户的电力设备特性和需求进行分析和辨识的过程。工业电力负荷辨识的目的是为了优化电力系统的运行和规划,提高电能利用效率,降低电网损耗,保障供电可靠性和安全性。特征选择是模型搭建中的一个重要步骤,它可以提高模型的效率和可解释性,以及降低过拟合的风险。基于信息论和遗传算法的思想,平衡优化器(eo)通过最大化互信息和最小化冗余来寻找最优结果。同时,作为一种用于特征选择的算法,eo可以在保持分类准确率的同时,减少特征的数量。为应对传统分类算法的不足,自适应增强算法(adaboost)分类器被提出。作为一种基于集成学习的算法,它的核心思想是通过构建并结合多个弱分类器(如决策树、神经网络等),来形成一个强分类器,从而提高分类性能和泛化能力。
技术实现要素:
4.针对以上技术问题本发明的目的是提供一种基于eo特征选择结合adaboost算法的工业电力负荷辨识方法。该发明优点在于可以有效地提高工业电力负荷辨识的准确性和鲁棒性。
5.本发明解决其技术问题采取的技术方案是:
6.一种基于eo特征选择结合adaboost算法的工业电力负荷辨识方法,方法包括以下步骤:
7.步骤一:采集工业用电场景中多种设备的电力负荷参数,构建原始功率数据集。对所述数据进行预处理,并根据一定比例规则的划分数据集为训练集和测试集;
8.步骤二:考虑到采集样本的质量和电力负荷的复杂性,对原始功率数据进行时频域特征提取;
9.步骤三:使用平衡优化器算法(eo)作为基于包装器的特征选择算法,通过判别分析(da)筛选出最优特征子集;
10.步骤四:将筛选出的最优特征子集输入至自适应增强算法(adaboost)模型进行训
练,得到训练好的模型。使用测试集进行识别实验,并输出数据对应的类别和准确率。
11.进一步的,步骤一中,采集工业用电场景中多种设备的电力负荷参数,是指通过专业的仪器和方法,测量和记录不同类型的工业设备在运行过程中的电压、电流、功率、功率因数等指标。这些参数反映了设备的能耗状况和运行效率。采样时间间隔为每分钟1次。
12.进一步的,步骤一中,电力数据预处理方法是指对电力系统采集的原始数据进行一定的处理,以提高数据的质量和可用性,为后续的分析和应用提供有效的支持。其中包括数据清洗和去噪,具体为检测并删除或修正异常数据,如缺失值、噪声值、错误值等,保证数据的完整性和准确性。
13.进一步的,步骤一中,将预处理后的数据集按9:1划分为训练集和测试集。
14.进一步的,步骤二中,原始功率数据进行时频域特征提取是一种常用的信号分析方法,可以从功率信号中提取出有用的信息,如频率、幅值、相位等。其时频域特征提取的步骤如下:
15.(1)对预处理后的功率数据进行傅里叶变换,将时域信号转换为频域信号,得到时频谱图。其中计算所需的频率是通过快速傅立叶变换获得的,这是一种在计算机上执行离散傅立叶变换的快速算法。在信号处理中,离散傅立叶变换的计算有着重要的地位。信号的相关、滤波、频谱估计等可以通过离散傅立叶变换来实现。离散时间信号x(n)的连续傅里叶变换定义为:
[0016][0017]
由于x(e
jω
)是一个连续函数,在计算机上无法计算。因此,我们可以离散近似x(n)的频谱后,再在计算机上进行频谱分析。有限长的离散信号x(n),n=0,1,2,
…
,n-1的离散傅立叶变换定义为:
[0018][0019]
其中,wn=e
(-j2σ/n)
,n=0,1,2,
…
,n-1。其反变换定义为:
[0020][0021]
矩阵形式的离散傅里叶变换为x=a
·
x。其中变换矩阵a为:
[0022][0023]
(2)对时频谱图进行滤波、分割、二元化等处理,去除噪声和无关信息,突出信号的时频特征;
[0024]
(3)对处理后的时频谱图进行特征提取,可以使用统计方法、几何方法、模式识别方法等,提取信号的时频参数、形状、纹理等特征;所提取的特征构成联合特征集。
[0025]
进一步的,步骤三中,eo特征选择可以从高维数据中选取一些有用的特征子集,以降低数据的复杂度和提高模型的性能。其具体流程如下:
[0026]
(1)初始化一个二进制矩阵作为种群,每一行代表一个个体,每一列代表一个特
征,1表示选取该特征,0表示舍弃该特征;
[0027]
(2)计算每个个体的适应度值,根据某个评价指标(如分类准确率、信息增益等)评估选取的特征子集对目标任务的贡献;
[0028]
(3)根据适应度值排序,确定当前平衡池状态,即选取适应度最高的四个个体和它们的平均值作为候选解;
[0029]
(4)更新指数项系数f,用于控制全局搜索和局部搜索之间的平衡;
[0030]
(5)更新质量生成速率g,用于加强局部寻优能力;
[0031]
(6)更新每个个体的二进制矩阵,根据平衡池状态、指数项系数和质量生成速率进行变异操作;
[0032]
(7)判断是否满足停止条件(如达到最大迭代次数或适应度值不再改善),如果满足则输出最优解(即适应度最高的个体),否则返回第二步继续迭代。
[0033]
进一步的,步骤四中,将最优特征子集输入至自适应增强算法(adaboost)模型,该模型通过迭代地训练多个弱分类器,并根据每个弱分类器的错误率分配权重,最后将所有弱分类器组合成一个强分类器。此方法基本路线为:
[0034]
(1)首先从训练数据中选择一个最优特征子集,然后用这个子集作为输入,构建一个初始的弱分类器;
[0035]
(2)接着,在每一轮迭代中,根据上一轮的分类结果,更新训练数据的权重分布,使得被错误分类的样本获得更高的权重,而被正确分类的样本获得更低的权重;
[0036]
(3)然后再训练一个新的弱分类器。这样重复进行,直到达到预设的迭代次数或者错误率达到一个很小的值为止;
[0037]
(4)最后,将所有训练得到的弱分类器按照它们在训练过程中表现出来的准确性加权平均,得到一个最终的强分类器,并使用强分类器对多种电力负荷进行分类。
[0037]
上述一种基于eo特征选择结合adaboost算法的工业电力负荷辨识方法,有效提高了工业用电场景下神经网络对电力复合的识别精度。通过平衡优化器完成特征选择大大降低了原始功率数据的维度,更适合部署在内存有限以及计算资源有限的嵌入式设备,更有利于实际工业中在线使用。本技术所提出的方法能够很好的应用于工业电力设备的准确分类,有效降低了现有的硬件要求。
附图说明
[0038]
图1为本发明一实施例中一种基于eo特征选择结合adaboost算法的工业电力负荷辨识流程图;
[0039]
图2为本发明一实施例中典型工业电力设备预处理前后负荷曲线对比图;
[0040]
图3为本发明一实施例中eo特征选择流程图;
[0041]
图4为本发明一实施例中adaboost模型的示意图;
[0042]
图5为本发明一实施例中测试集电力负荷识别的混淆矩阵;
具体实施方式
[0043]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于
本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0044]
本发明实施例公开了一种基于eo特征选择结合adaboost算法的工业电力负荷辨识方法,如图1,包括:
[0045]
步骤一:采集工业用电场景中多种设备的电力负荷参数,构建原始功率数据集。对所述数据进行预处理,并根据一定比例规则的划分数据集为训练集和测试集;
[0046]
具体地,本研究采集的电力负荷样本完全来自实际的中国工厂。通过专业的采样仪器,测量和记录9种工业设备在运行过程中的电流、电压、有功功率、无功功率等指标。各类仪器的采样频率都为1/60hz。电力数据的预处理是指对原始电力数据进行清洗、校验、插补、平滑等操作,以提高数据的质量和可用性。,预处理前后典型工业电力设备的有功功率和无功功率曲线变化如图2。其中,电力负荷数据的具体预处理方法包括以下几个步骤:
[0047]
(1)数据清洗:删除或修正异常值、噪声值、缺失值等影响数据分析的无效数据;
[0048]
(2)数据校验:检查数据是否符合物理规律和统计规律,如电压和频率是否在合理范围内,有功功率和无功功率是否满足潮流方程等;
[0049]
(3)数据插补:对缺失值进行合理的填充,如使用线性插值、样条插值、回归分析等方法;
[0050]
(4)数据平滑:消除或减小数据中的短期波动,如使用移动平均法、指数平滑法、小波变换等方法。
[0051]
步骤二:考虑到采集样本的质量和电力负荷的复杂性,对原始功率数据进行时频域特征提取;
[0052]
在一个实施例中,为了从功率信号提取出有用的信息,如频率、幅值、相位等。具体的时频域特征提取的步骤如下:
[0053]
(1)对预处理后的功率数据进行傅里叶变换,将时域信号转换为频域信号,得到时频谱图。其中计算所需的频率是通过快速傅立叶变换获得的,这是一种在计算机上执行离散傅立叶变换的快速算法。在信号处理中,离散傅立叶变换的计算有着重要的地位。信号的相关、滤波、频谱估计等可以通过离散傅立叶变换来实现。离散时间信号x(n)的连续傅里叶变换定义为:由于x(e
jω
)是一个连续函数,在计算机上无法计算。因此,我们可以离散近似x(n)的频谱后,再在计算机上进行频谱分析。有限长的离散信号x(n),n=0,1,2,
…
,n-1的离散傅立叶变换定义为:其中,wn=e
(-j2σ/n
),n=0,1,2,
…
,n-1。其反变换定义为:矩阵形式的离散傅里叶变换为x=a
·
x。其中变换矩阵a为:
[0053]
(2)对时频谱图进行滤波、分割、二元化等处理,去除噪声和无关信息,突出信号的时频特征;
[0054]
(3)对处理后的时频谱图进行特征提取,可以使用统计方法、几何方法、模式识别方法等,提取信号的时频参数、形状、纹理等特征,将所有种类的时频域特征汇总构建联合特征集。
[0055]
步骤三:使用平衡优化器算法(eo)作为基于包装器的特征选择算法,通过判别分析(da)筛选出最优特征子集;
[0056]
在一个实施例中,eo特征选择可以从高维数据中选取一些有用的特征子集,以降低数据的复杂度和提高模型的性能。eo算法流程如图3,其具体包括以下步骤:
[0057]
(1)初始化一个二进制矩阵作为种群,每一行代表一个个体,每一列代表一个特征,1表示选取该特征,0表示舍弃该特征;
[0058]
(2)计算每个个体的适应度值,根据某个评价指标(如分类准确率、信息增益等)评估选取的特征子集对目标任务的贡献;
[0059]
(3)根据适应度值排序,确定当前平衡池状态,即选取适应度最高的四个个体和它们的平均值作为候选解;
[0060]
(4)更新指数项系数f,用于控制全局搜索和局部搜索之间的平衡;
[0061]
(5)更新质量生成速率g,用于加强局部寻优能力;
[0062]
(6)更新每个个体的二进制矩阵,根据平衡池状态、指数项系数和质量生成速率进行变异操作;
[0063]
(7)判断是否满足停止条件(如达到最大迭代次数或适应度值不再改善),如果满足则输出最优解(即适应度最高的个体),否则返回第二步继续迭代。
[0064]
步骤四:将筛选出的最优特征子集输入至自适应增强算法(adaboost)模型进行训练,得到训练好的模型。使用测试集进行识别实验,并输出数据对应的类别和准确率。
[0065]
在一个实施例中,将最优特征子集输入至adaboost模型,该模型通过迭代地训练10个弱分类器,并根据每个弱分类器的错误率分配权重,最后将所有弱分类器组合成一个强分类器。adaboost模型构建路线如图4,其中基本包括以下步骤为:
[0066]
(1)首先从训练数据中选择一个最优特征子集,然后用这个子集作为输入,构建一个初始的弱分类器;
[0067]
(2)接着,在每一轮迭代中,根据上一轮的分类结果,更新训练数据的权重分布,使得被错误分类的样本获得更高的权重,而被正确分类的样本获得更低的权重;
[0068]
(3)然后再训练一个新的弱分类器。这样重复进行,直到达到预设的迭代次数或者错误率达到一个很小的值为止;
[0069]
(4)最后,将所有训练得到的弱分类器按照它们在训练过程中表现出来的准确性加权平均,得到一个最终的强分类器,并使用强分类器对多种电力负荷进行分类。
[0070]
在一个实施例中,将最优特征子集输入至adaboost模型,分类结果如图5。为了更直观的展示本技术在工业场景中电力负荷识别的实际效果。作者使用混淆矩阵来显示电力负荷的分类细节,结果如图5。从图5中,可以清晰的了解每个工业设备的识别情况。其中类型为ete的设备有82%预测正确,有18%错误预测为cmw。类型为cme的设备有85%预测正确,5%错误预测为ete,5%错误预测为cmw,5%错误预测为cca。其中类型编号为kht的设备有95%预测正确,5%错误预测为cca。其余设备全部预测正确。因此,本技术的方法可以准确的分析出工业设备的类型。
[0071]
以上对本发明所提供的一种基于eo特征选择结合adaboost算法的工业电力负荷辨识方法进行了详细介绍。本文中应用了具体个例对本发明的原理以及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
技术特征:
1.一种基于eo特征选择结合adaboost算法的工业电力负荷辨识方法,此方法包括以下步骤:s1、采集工业用电场景中多种设备的电力负荷参数,构建原始功率数据集。对所述数据进行预处理,并根据一定比例规则的划分数据集为训练集和测试集;s2、考虑到采集样本的质量和电力负荷的复杂性,对原始功率数据进行时频域特征提取;s3、使用平衡优化器算法(eo)作为基于包装器的特征选择算法,通过判别分析(da)筛选出最优特征子集;s4、将筛选出的最优特征子集输入至自适应增强算法(adaboost)模型进行训练,得到训练好的模型。使用测试集进行识别实验,并输出数据对应的类别和准确率。2.根据权利要求1所述的一种基于eo特征选择结合adaboost算法的工业电力负荷辨识方法,其特征在于:所述s1中,采集工业用电场景中多种设备的电力负荷参数,是指通过专业的仪器和方法,测量和记录不同类型的工业设备在运行过程中的电压、电流、功率、功率因数等指标。这些参数反映了设备的能耗状况和运行效率。采样时间间隔为每分钟1次。3.根据权利要求1所述的一种基于eo特征选择结合adaboost算法的工业电力负荷辨识方法,其特征在于:所述s1中,电力数据预处理方法是指对电力系统采集的原始数据进行一定的处理,以提高数据的质量和可用性,为后续的分析和应用提供有效的支持。其中包括数据清洗和去噪,具体为检测并删除或修正异常数据,如缺失值、噪声值、错误值等,保证数据的完整性和准确性。4.根据权利要求1所述的一种基于eo特征选择结合adaboost算法的工业电力负荷辨识方法,其特征在于:所述s2中,原始功率数据进行时频域特征提取是一种常用的信号分析方法,可以从功率信号中提取出有用的信息,如频率、幅值、相位等。时频域特征提取的步骤如下:s21、对预处理后的功率数据进行傅里叶变换,将时域信号转换为频域信号,得到时频谱图。其中计算所需的频率是通过快速傅立叶变换获得的,这是一种在计算机上执行离散傅立叶变换的快速算法。在信号处理中,离散傅立叶变换的计算有着重要的地位。信号的相关、滤波、频谱估计等可以通过离散傅立叶变换来实现。离散时间信号x(n)的连续傅里叶变换定义为:由于x(e
jω
)是一个连续函数,在计算机上无法计算。因此,我们可以离散近似x(n)的频谱后,再在计算机上进行频谱分析。有限长的离散信号x(n),n=0,1,2,
…
,n-1的离散傅立叶变换定义为:其中,w
n
=e
(-j2σ/n)
,n=0,1,2,
…
,n-1。其反变换定义为:矩阵形式的离散傅里叶变换为x=a
·
x。其中变换矩阵a为:
s22、对时频谱图进行滤波、分割、二元化等预处理,去除噪声和无关信息,突出信号的时频特征;s23、对预处理后的时频谱图进行特征提取,可以使用统计方法、几何方法、模式识别方法等,提取信号的时频参数、形状、纹理等特征。5.根据权利要求1所述的一种基于eo特征选择结合adaboost算法的工业电力负荷辨识方法,其特征在于:所述s3中,eo特征选择可以从高维数据中选取一些有用的特征子集,以降低数据的复杂度和提高模型的性能。其具体流程如下:s31、初始化一个二进制矩阵作为种群,每一行代表一个个体,每一列代表一个特征,1表示选取该特征,0表示舍弃该特征;s32、计算每个个体的适应度值,根据某个评价指标(如分类准确率、信息增益等)评估选取的特征子集对目标任务的贡献;s33、根据适应度值排序,确定当前平衡池状态,即选取适应度最高的四个个体和它们的平均值作为候选解;s34、更新指数项系数f,用于控制全局搜索和局部搜索之间的平衡;s35、更新质量生成速率g,用于加强局部寻优能力;s36、更新每个个体的二进制矩阵,根据平衡池状态、指数项系数和质量生成速率进行变异操作;s37、判断是否满足停止条件(如达到最大迭代次数或适应度值不再改善),如果满足则输出最优解(即适应度最高的个体),否则返回第二步继续迭代。6.根据权利要求1所述的一种基于eo特征选择结合adaboost算法的工业电力负荷辨识方法,其特征在于:所述s4中,将最优特征子集输入至自适应增强算法(adaboost)模型,该模型通过迭代地训练多个弱分类器,并根据每个弱分类器的错误率分配权重,最后将所有弱分类器组合成一个强分类器。此方法基本路线为:s41、首先从训练数据中选择一个最优特征子集,然后用这个子集作为输入,构建一个初始的弱分类器;s42、接着,在每一轮迭代中,根据上一轮的分类结果,更新训练数据的权重分布,使得被错误分类的样本获得更高的权重,而被正确分类的样本获得更低的权重;s43、然后再训练一个新的弱分类器。这样重复进行,直到达到预设的迭代次数或者错误率达到一个很小的值为止;s44、最后,将所有训练得到的弱分类器按照它们在训练过程中表现出来的准确性加权平均,得到一个最终的强分类器,并使用强分类器对多种电力负荷进行分类。
技术总结
本发明公开了一种基于EO特征选择结合AdaBoost算法的工业电力负荷辨识方法,包括采集工业用电场景中多种设备的电力负荷参数,构建原始功率数据集,对所述数据进行预处理,并根据一定比例规则的划分数据集为训练集和测试集;考虑到采集样本的质量和电力负荷的复杂性,对原始功率数据进行时频域特征提取;使用EO作为基于包装器的特征选择算法,通过DA筛选出最优特征子集;将筛选出的最优特征子集输入至AdaBoost模型进行训练,得到训练好的模型。使用测试集进行识别实验,并输出数据对应的类别和准确率。此方法有效提高了工业用电场景下电力负荷的识别准确率,解决了传统电力负荷识别模型复杂度高难以实际应用在工业现场的问题。题。题。
技术研发人员:姚小康 周孟然 刘宇 汪锟 王昊男 朱梓伟
受保护的技术使用者:安徽理工大学
技术研发日:2023.03.29
技术公布日:2023/8/9
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/
上一篇:一种自动弹开玻璃窗的制作方法 下一篇:一种液化气船的压缩机房盆舾装工艺的制作方法