基于半监督学习和k均值聚类算法的动力电池SOH估计方法

未命名 09-18 阅读:122 评论:0

基于半监督学习和k均值聚类算法的动力电池soh估计方法
技术领域
1.本发明属于动力电池技术领域,涉及一种基于半监督学习和k均值聚类算法的动力电池soh估计方法。


背景技术:

2.准确的容量估算对于锂离子电池的可靠、安全运行至关重要。当前研究主要针对实验室电池数据,其具有质量高,特征之间相关性强特点,并且所需数据量较大以满足机器学习训练。针对电动汽车实际运行云平台数据,其线下实测数据量较少,不能够满足机器学习所需数据量大的特点。半监督学习使用大量的未标记数据,以及同时使用少量的标记数据,来进行模式识别工作,可以利用较少的有效数据量来实现预测效果。
3.为解决有效数据量较少问题,北京理工大学的xiong等人(“semi-supervised estimation of capacity degradation for lithium-ion batteries with electrochemical impedance spectroscopy”)提出了在容量测量缺失的情况下使用电化学阻抗谱(eis)数据进行容量预测;所提出的神经网络在容量子集和eis标记样本上进行训练。然而,由于eis测试对运行和寿命的影响,在实践中eis数据并不是连续可用的。che等人(“semi-supervised self-learning-based lifetime prediction for batteries”)提出了一种基于半监督自学习的基于实验数据的寿命预测方法。然而,实车云平台数据质量较差,极大的降低了方法的适用性范围。并且,现有锂离子电池soh估计限于实验室数据,其具有稳定的工况,且特征之间有一定的关联,但实际运行数据具有工况不唯一,放电电流不稳定等特点,导致其方法不适用于实车soh估计。
4.因此,亟需一种能够提高动力电池soh估计精度的方法来解决现有技术的问题。


技术实现要素:

5.有鉴于此,本发明的目的在于提供一种基于半监督学习和k均值聚类算法的动力电池soh估计方法,提高实际运行中动力电池的soh估计精度。
6.为达到上述目的,本发明提供如下技术方案:
7.一种基于半监督学习和k均值聚类算法的动力电池soh估计方法,具体包括以下步骤:
8.s1:使用安时积分变体公式,利用基于实车运行的云平台数据计算电池组的标签容量并与线下测试容量对比;
9.s2:根据ic曲线,选取一定电压区间的特征值,包括电池组电压,充电电流、电池单体温度等统计特征值,利用pearson相关性分析,选取pearson相关系数在0.7以上的特征值作为容量估计模型的输入;
10.s3:利用k均值聚类方法对数据集进行分类,利用高斯过程回归,建立容量估计模型,对每一类具有标签容量的数据进行训练,并为其余数据贴上伪标签,之后将数据集合并,重新训练一个容量估计模型。
11.进一步,步骤s1中,利用安时变体公式计算出标签容量,并与线下实测容量对比,误差小于5%以内,将标签容量认为是真实值。
12.进一步,步骤s1中,标签容量q
label
的计算公式为:
[0013][0014]
其中,soc
start
、soc
end
分别表示充电起始和结束时刻的soc值,i表示充电片段电流。
[0015]
进一步,步骤s2中,pearson相关系数r的表达式为:
[0016][0017]
其中,xi为第i个特征序列,为第i个特征序列均值,yi为第i个输出序列,为输出序列均值。
[0018]
进一步,步骤s3中,所述k均值聚类方法的具体步骤为:
[0019]
1)初始化,根据数据集特征数量,合理选择k个初始聚类的中心;
[0020]
2)对数据集进行聚类,计算每个数据集到每个中心的欧氏距离,将每个数据集集中到与其最近的中心的类中,构成聚类结果;
[0021]
3)计算聚类后每个数据集的均值,作为新的类中心;
[0022]
4)重复步骤2)~步骤3),直到聚类结果不再发生改变。
[0023]
本发明的有益效果在于:
[0024]
1)本发明可以针对实车运行数据进行精确地soh估计,为更换电池和故障诊断提供和理论支撑。
[0025]
2)本发明利用ic曲线选取一定电压区间的特征值,有效地利用现有数据集。
[0026]
3)本发明利用半监督学习方法可以有效解决线下测试数据量较少的问题,并可扩大数据集。
[0027]
4)本发明只利用充电片段就可准确预测电池soh。
[0028]
5)本发明利用半监督学习和高斯过程回归可将实车运行数据集soh估计精度达到95%以上。
[0029]
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。
附图说明
[0030]
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作优选的详细描述,其中:
[0031]
图1为本发明基于半监督学习和k均值聚类算法的动力电池soh估计方法流程图;
[0032]
图2为特征相关性示意图;
[0033]
图3为特征区间的选取示意图;
[0034]
图4为相关性系数的选择示意图;
[0035]
图5为模型估计的平均绝对误差示意图。
具体实施方式
[0036]
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
[0037]
请参阅图1~图5,本发明提供一种基于半监督学习和k均值聚类算法的动力电池soh估计方法,如图1所示,该方法基于实车运行的云平台数据,其数据包含运行时间、充电状态、电池soc、充放电电流、行驶里程、电池组电压、电池单体电压最大/最小值、单体温度最高/最低值等。将数据分为训练集和测试集两类。提取训练集车辆充电段数据,利用安时变体公式计算出标签容量,并与线下实测容量对比,误差小于5%以内,将标签容量认为是真实值,利用k均值聚类算法将容量分为n类,进而筛选其容量对应的充电片段特征,可以为电池单体电压最大/最小值、单体温度最高/最低值、soc、充电电流等,利用pearson和灰色关联度法筛选出与容量高度相关的特征,之后利用高斯过程回归(gpr)模型训练标签容量具有与线下测试误差在5%之内的数据,然后预测训练集中未有标签容量的数据,其输出将作为伪标签,之后将两者数据结合,重新训练一个gpr模型。测试集中未标签的数据特征作为新的gpr模型输入,验证模型的有效性。
[0038]
标签容量q
label
的计算公式为:
[0039][0040]
其中,soc
start
、soc
end
分别表示充电起始和结束时刻的soc值,i表示充电片段电流。
[0041]
pearson相关系数r的表达式为:
[0042][0043]
其中,xi为第i个特征序列,为第i个特征序列均值,yi为第i个输出序列,为输出序列均值。
[0044]
k均值聚类算法:
[0045]
输入:n个数据集;
[0046]
输出:数据集合的聚类。
[0047]
准则函数:聚类集中每一个样本点到该类中心距离的平方数之和,使其最小化。
[0048]
对所有k个模式类有:
[0049]
[0050]
其中,sj为第j个聚类集,zj为聚类中心;nj为第j个聚类集sj中所包含的样本个数。
[0051]
目标:聚类中心的选择应使准则函数j极小。
[0052]
k均值聚类算法的具体流程为:
[0053]
1)任选k个初始聚类中心:z1(1),z2(2),

,zk(l),括号内序号代表迭代次序。
[0054]
2)按最小距离原则将其余样本分配到k个聚类中心的某一个,
[0055]
若min{||x-zi(k)||,i=1,2,

,k}=||x-zi(k)||=dj(k),x∈sj(k)
[0056]
其中,k为迭代运算次序,k为聚类中心个数。
[0057]
3)计算各个聚类中心的新向量值:zj(k+1),j=1,2,

,k
[0058][0059]
nj为第j类的样本数。
[0060]
4)判断
[0061]
若zj(k+1)≠zj(k),j=1,2,

,k,重复步骤2);
[0062]
若zj(k+1)=zj(k),j=1,2,

,k,计算结束。
[0063]
高斯过程回归:
[0064]
f(x)~gp(m(x),k(x,x

))
[0065]
其中,m(x)为均值函数,k(x,x

)为协方差函数。
[0066]
m(x)=e[f(x)]
[0067]
x(x,x

)=e[(f(x)-m(x))(f(x

)-m(x

))
t
]
[0068]
其中,t表示转置。
[0069]
概率密度函数:
[0070][0071]
具体实验:
[0072]
1、选取特征相关性绝对平均值,参见图2。
[0073]
同一特征,在不同车辆中和容量的相关性有整有负数,故选择用其绝对值求平均,来评估特征和整体车辆的相关性。
[0074]
2、选取特征区间
[0075]
为使提取的特征不局限于标签容量计算的条件,选取最大单体电压处于[3700,4000]的充电数据进行特征提取(覆盖尽可能多的充电情况),参见图3。
[0076]
3、使用先进的机器学习算法-高斯过程回归,建立容量估计模型。基于先前提取的特征,对soh进行估计,该问题是一个典型的回归问题,而基于高斯过程回归(gpr)的机器学习方法具有非参数建模、概率预测、相对鲁棒性、计算复杂度可接受性的优点,非常适合用于soh估计。
[0077]
最终,一共得到169个有效片段,并根据上一节特征提取的结果,选择容量相关性大于0.7的v_ave、soc_ave、vmax_ave、vmin_ave、v_std、vmax_std、vmin_std七个特征作为模型输入,参见图4。
[0078]
4、随机将已有数据划分为训练集(80%)和测试集(20%);重复实验10次,模型估
计的平均绝对误差(mae)均小于5%。如图5所示,五角星代表预测soh,浅灰色灰色区域代表预测soh的置信度区间,深灰色圆点代表实际soh,虚线代表估计误差。
[0079]
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

技术特征:
1.一种基于半监督学习和k均值聚类算法的动力电池soh估计方法,其特征在于,该方法具体包括以下步骤:s1:使用安时积分变体公式,利用基于实车运行的云平台数据计算电池组的标签容量并与线下测试容量对比;s2:根据ic曲线,选取某电压区间的特征值,利用pearson相关性分析,选取pearson相关系数在0.7以上的特征值作为容量估计模型的输入;s3:利用k均值聚类方法对数据集进行分类,利用高斯过程回归,建立容量估计模型,对每一类具有标签容量的数据进行训练,并为其余数据贴上伪标签,之后将数据集合并,重新训练一个容量估计模型。2.根据权利要求1所述的动力电池soh估计方法,其特征在于,步骤s1中,利用安时变体公式计算出标签容量,并与线下实测容量对比,误差小于5%以内,将标签容量认为是真实值。3.根据权利要求1或2所述的动力电池soh估计方法,其特征在于,步骤s1中,标签容量q
label
的计算公式为:其中,soc
start
、soc
end
分别表示充电起始和结束时刻的soc值,i表示充电片段电流。4.根据权利要求1所述的动力电池soh估计方法,其特征在于,步骤s2中,选取的特征值包括电池组电压、充电电流和电池单体温度的统计特征值。5.根据权利要求1或4所述的动力电池soh估计方法,其特征在于,步骤s2中,pearson相关系数r的表达式为:其中,x
i
为第i个特征序列,为第i个特征序列均值,y
i
为第i个输出序列,为输出序列均值。6.根据权利要求1所述的动力电池soh估计方法,其特征在于,步骤s3中,所述k均值聚类方法的具体步骤为:1)初始化,根据数据集特征数量,合理选择k个初始聚类的中心;2)对数据集进行聚类,计算每个数据集到每个中心的欧氏距离,将每个数据集集中到与其最近的中心的类中,构成聚类结果;3)计算聚类后每个数据集的均值,作为新的类中心;4)重复步骤2)~步骤3),直到聚类结果不再发生改变。

技术总结
本发明涉及一种基于半监督学习和k均值聚类算法的动力电池SOH估计方法,属于动力电池技术领域。该方法包括:S1:使用安时积分变体公式,利用基于实车运行的云平台数据计算电池组的标签容量并与线下测试容量对比;S2:根据IC曲线,选取一定电压区间的特征值,利用Pearson相关性分析,选取Pearson相关系数在0.7以上的特征值作为容量估计模型的输入;S3:利用k均值聚类方法对数据集进行分类,利用高斯过程回归,建立容量估计模型,对每一类具有标签容量的数据进行训练,并为其余数据贴上伪标签,之后将数据集合并,重新训练一个容量估计模型。本发明能提高实际运行中动力电池的SOH估计精度。度。度。


技术研发人员:张永志 贾元威
受保护的技术使用者:重庆大学
技术研发日:2023.07.04
技术公布日:2023/9/14
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐