一种在线实时优化多列车协同巡航控制方法及系统

未命名 07-03 阅读:82 评论:0


1.本发明属于轨道交通列车智能运行控制技术领域,具体涉及一种在线实时优化多列车协同巡航控制方法及系统。


背景技术:

2.在铁路建设发展政策的支持下,铁路所承担的旅客运输和货物运输任务日益繁重,其运载能力面临着越来越严峻的考验。近年来,通过兴建铁路、修建越行站、以及线路复线化等方式,在一定程度上缓解了铁路运输压力。然而,运能紧张问题依然存在。
3.多列车协同巡航控制策略是解决日益繁重的铁路运输压力的一种行之有效的方法。国内外在多列车协同巡航控制方面的研究十分丰富。然而由于多列车协同运行过程处于动态调整之中,各阶段的控制性能要求存在差异,大多数协同巡航控制方法采用固定协同控制增益,不具有自适应性,难以达到最优控制效果,造成较大超调和波动调整,收敛速度慢。因此,针对协同控制策略的增益系数展开实时优化,提高多列车巡航系统的整体控制性能起着重要作用。然而现有优化求解方法大多收敛速度慢,耗时多,难以在多列车协同巡航的实时控制系统中在线运行。


技术实现要素:

4.本发明的目的是解决现有多列车协同最优控制方法中协同控制增益固定不变、最优值求解效率不高的技术问题,进而提供一种在线实时优化多列车协同巡航控制方法及系统。其中,现有多列车协同控制策略存在控制增益非最优且固定不变,或现有多列车协同控制策略是利用离线优化算法求解一个固定最优值,导致收敛速度慢,收敛过程瞬时超调量大,易超出安全范围的技术缺陷。本发明技术方案提供的所述控制方法真正意义上实现了在实时列车运行控制系统上运行的多列车协同巡航在线优化控制技术,其中,时变协同控制增益随状态变化而实时调整,促使列车间以最快速度稳定到一致的运行状态,提升了多列车协同巡航的收敛速度,并减小了瞬时超调量,满足列车安全高效运行的需求。
5.一方面,本发明提供的一种在线实时优化多列车协同巡航控制方法,其包括以下步骤:步骤1:获取列车的实时运行信息和位置信息;步骤2:引入时变协同控制增益,构建基于距离偏差和速度偏差的时变协同控制律;其中,所述时变协同控制增益包括距离偏差增益与速度偏差增益,且数值均动态变化;所述距离偏差表示两通讯列车之间的实际距离与期望安全距离之间的偏差,所述速度偏差表示两通讯列车之间的实时速度偏差;步骤3:将列车实时的距离偏差和速度偏差输入训练好的神经网络,获得实时的全局最优的时变协同控制增益;所述神经网络的输入为列车的距离偏差和速度偏差,输出为全局最优的时变协同控制增益;
步骤4:基于所述全局最优的时变协同控制增益得到所述时变协同控制律,再基于所述时变协同控制律,并利用列车的牵引制动系统产生牵引力或制动力,进而控制各列车的加速度变化;其中,所述时变协同控制律具体表示为列车所受到的牵引力或者制动力。
6.本发明针对多列车协同最优控制问题展开进一步研究,根据状态变化在线优化协同控制增益,提高时效性,在保证列车安全运行的前提下,提升多列车协同巡航的收敛速度,减小瞬时超调量,以提升铁路的整体运营效率。
7.具体的,本发明提供的所述多列车协同巡航控制方法的技术方案,其通过引入时变协同控制增益构建了基于距离偏差和速度偏差的时变协同控制律,从而实现了将动态变化的时变协同控制增益引入到了列车的控制系统中,可以获取随状态变化的最优时变协同控制律,以最快速度减小距离和速度偏差,同时减小超调量,在确保列车运行安全的前提下,降低多列车协同一致的调整时间。此外,本发明技术方案引入神经网络,利用训练好的神经网络可以求解不同时刻不同状态下的全局最优的时变协同控制增益,以解决现有多列车协同巡航控制优化方法(布谷鸟算法,遗传算法,基因进化算法等智能启发式算法)求解收敛速度慢,难以在线实时运行的缺点。综上可知,本发明提供的技术方案能够实时在线求解最优协同控制增益,缩短协同收敛过程,降低超调范围,改善铁路的整体运营效率。应当理解,本发明实施例选用bp神经网络,其他可行的实施例中,可以选择具备预测功能的其他类型神经网络,本发明对此不进行具体的限定。
8.进一步可选地,步骤2中构建的时变协同控制律表示为:其中,ui(t)表示列车i的所受到的牵引力或者制动力;k1(t)、k2(t)均为待确定的时变协同控制增益,分别对应距离偏差增益、速度偏差增益;a
ij
为列车i与列车j的通信关系系数,如果存在通信,a
ij
为1,否则a
ij
为0,且,vi(t)、vj(t)分别表示列车i、列车j的实时速度;xi(t)、xj(t)分别表示列车i、列车j的实时位置,n为多列车协同系统中的列车总数,d为给定的两车之间期望安全距离,t表示时间。
9.进一步可选地,所述步骤3中神经网络是基于训练集训练的,所述训练集是由经过多次状态采样得到的距离偏差和速度偏差、及对应的全局最优的时变协同控制增益构成的;其中,每一次通过状态采样得到的距离偏差、速度偏差后,利用布谷鸟搜索算法计算得到全局最优的时变协同控制增益,具体如下:步骤3.1:初始化设置布谷鸟搜索算法相关参数:鸟巢总数m,发现概率p∈[0,1],最大迭代次数n,以及n1个初始种群,,x1,x2,x3分别表示第1个、第2个、第n1个布谷鸟找的鸟巢位置,、分别表示第n1个布谷鸟找的鸟巢位置对应的距离偏差增益、速度偏差增益,n1为布谷鸟个数;步骤3.2:按照如下规则更新种群中每一个鸟巢位置;其中,通过莱维飞行到达一个新鸟巢位置后计算目标函数值,再将其与上一代鸟
巢位置的目标函数值比较,如果目标函数值变小,则替代更新鸟巢位置,否则保持原鸟巢位置不变;所述莱维飞行的公式如下:式中,α为步长,levy(β)为莱维随机路径,t对应迭代次数,xi(t)、xi(t-1)分别表示第i个布谷鸟在第t次迭代、第t-1次迭代找到的鸟巢位置;步骤3.3:得到新种群的鸟巢位置后,随机产生服从 0 到 1 均匀分布的数值r,并与发现概率p比较,如果r大于p,则随机更新一次鸟巢位置,再计算鸟巢位置更新后的目标函数值,如果目标函数值更小,则替代更新原鸟巢位置,否则保持原鸟巢位置;如果r小于或等于p,则保持当前鸟巢位置;步骤3.4:找出当前所有鸟巢中的最优位置,其中,目标函数值最小对应的鸟巢位置为最优位置;步骤3.5:判断是否达到最大迭代次数,如是,输出最优位置,即得到代入的当前状态采样所对应的全局最优的时变协同控制增益中的距离偏差增益与速度偏差增益;如没有达到所述最大迭代次数,则循环步骤3.2-3.5直至达到所述最大迭代次数;其中,按照步骤3.1-3.5循环多次,代入所有状态采样,则可以得到不同状态采样所对应的全局最优协同增益,进而构建出所述训练集。
[0010]
本发明技术方案利用布谷鸟搜索算法来构建训练集,进一步保证训练集中每个训练样本对应的时变协同控制增益是全局最优的时变协同控制增益,从而使得神经网络的精度更高,多列车系统控制系统的控制效果更好以及控制效率更佳。
[0011]
进一步可选地,所述目标函数的公式为:式中,j为所述目标函数,ui(t)表示列车i的所受到的牵引力或者制动力,对应构建的时变协同控制律;a
ij
为列车i与列车j的通信关系系数,如果存在通信,a
ij
为1,否则a
ij
为0,且;vi(t)、vj(t)别表示列车i、列车j的实时速度;xi(t)、xj(t)分别表示列车i、列车j的实时位置,n为多列车协同系统中的列车总数,d为给定的两车之间期望安全距离,t表示时间。
[0012]
进一步可选地,所述步骤3中的所述神经网络为bp神经网络,所述bp神经网络的训练步骤如下:s-1:初始化bp神经网络参数:输入层神经元个数为2,一个输入对应距离偏差,一个输入对应速度偏差;一层隐藏层,隐藏层的神经元个数取值为任意值;输出层神经元个数为2,对应距离偏差增益与速度偏差增益;链接权值初始化为(0,1)之间的任意值;s-2:从训练集中取某一训练样本,并输入所述bp神经网络;s-3:由bp神经网络正向计算出各层节点的输出;s-4:计算bp神经网络的实际输出和期望输出的误差;s-5:从输出层开始反向计算到第一个隐藏层,并采用梯度下降法向减少误差方向
调整整个bp神经网络的各个连接权值;s-6:对所述训练集中的每个训练样本重复上述步骤s-2至s-5,直到对整个bp神经网络的误差达到预设要求。
[0013]
进一步可选地,步骤1是各列车获取自身以及通讯列车的实时运行信息和位置信息。
[0014]
第二方面,本发明提供的一种在线实时优化多列车协同巡航控制方法,其应用于多列车协同控制系统的单列车,所述多列车协同巡航控制方法包括以下步骤:s1:当前列车获取自身及通讯列车的实时运行信息和位置信息;s2:引入时变协同控制增益,构建基于距离偏差和速度偏差的时变协同控制律;其中,所述时变协同控制增益包括距离偏差增益与速度偏差增益,且数值均动态变化;所述距离偏差表示两通讯列车之间的实际距离与期望安全距离之间的偏差,所述速度偏差表示量通讯列车之间的实时速度偏差;s3:将当前列车实时的距离偏差和速度偏差输入训练好的神经网络,获得实时的全局最优的时变协同控制增益;s4:基于所述全局最优的时变协同控制增益得到所述时变协同控制律,再基于所述时变协同控制律,并利用当前列车的牵引制动系统以产生牵引力或制动力,进而控制当前列车的加速度变化,其中,所述时变协同控制律具体表示为列车所受到的牵引力或者制动力。
[0015]
第三方面,本发明提供的一种基于所述多列车协同巡航控制方法的系统,其包括:多列车系统、运行信息采集子系统、列车通讯子系统以及控制子系统;所述多列车系统由多辆列车构成;所述运行信息采集子系统由各列车的车载设备和/或轨旁设备构成,用于采集各个列车的实时运行信息;所述列车通讯子系统由各列车的通讯模块和/或无线闭塞中心构成,用于构建列车之间的通讯连接,实现通讯列车之间的信息输送;所述控制子系统由各个列车的控制器构成,用于根据步骤2-步骤4或者根据步骤s2-步骤s4得到或获取各个列车的时变协同控制律,并作用于列车的牵引制动系统以产生牵引力或制动力,进而控制列车的加速度变化。
[0016]
第四方面,本发明提供的一种电子终端,其包括:一个或多个处理器;存储了一个或多个计算机程序的存储器;所述处理器调用所述计算机程序以实现:一种在线实时优化多列车协同巡航控制方法的步骤。
[0017]
第五方面,本发明提供的一种可读存储介质,其存储了计算机程序,所述计算机程序被处理器调用以实现:一种在线实时优化多列车协同巡航控制方法的步骤。
[0018]
有益效果本发明提供的一种在线实时优化多列车协同巡航控制方法,一方面其通过引入时变协同控制增益,利用神经网络可以求解不同时刻不同状态下的全局最优的时变协同控制
增益,可以获取随状态变化的最优的时变协同控制律,以最快速度减小距离和速度偏差,同时减小超调量,在确保列车运行安全的前提下,降低多列车协同一致的调整时间,提升铁路的整体运营效率。
[0019]
其次,本发明的优选方案中,针对神经网络的训练集,本发明技术方案是根据布谷鸟算法求解的距离偏差、速度偏差和最优协同控制增益的对应关系, 利用多次采样构建数据集训练神经网络,更进一步保证全局最优的时变协同控制增益的准确性。
[0020]
应当理解,基于该多列车协同巡航控制方法的控制系统,具有良好的控制性能,进一步保证列车运行的安全性和稳定性。综上,本发明技术方案提出的策略能根据状态变化可以实时在线获取时变协同控制增益的最优值,当速度和距离偏差较大时最优控制增益较大,加快跟踪收敛速度,当速度和距离偏差较小时最优控制增益较小,降低超调量,计算量小,是真正能在实时列车运行控制系统实际运行的控制方法。
附图说明
[0021]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0022]
图1是本发明提供的一种在线实时优化多列车协同巡航控制方法的最佳实施例的流程图;图2是本发明基于在线实时优化的的协同控制器结构图;图3是本发明提供的布谷鸟搜索算法流程图。
具体实施方式
[0023]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0024]
实施例1:为了解决现有多列车协同最优控制方法中协同控制增益固定不变、最优值求解效率不高的技术问题,即克服现有多列车协同控制策略存在控制增益非最优且固定不变,或现有多列车协同控制策略是利用离线优化算法求解一个固定最优值,导致收敛速度慢,收敛过程瞬时超调量大,易超出安全范围的技术缺陷。本发明实施例提供一种在线实时优化多列车协同巡航控制方法,其包括以下步骤:步骤1:获取列车的实时运行信息和位置信息;其中,各列车获取自身和通信相邻列车的实时运行位置信息和位置信息。
[0025]
本实施例中,列车通过车载通信模块从车载设备和轨旁设备获取自身的实时运行信息,并通过通信模块与无线闭塞中心通信将列车实时运行信息和位置信息实时传输给通信列车,以及获取通信列车实时运行信息和位置信息。
[0026]
本实施例是只考虑相邻列车能相互通信,其他可行的实施例中,还可以考虑非相
邻列车之间存在通信。
[0027]
步骤2:引入时变协同控制增益,构建基于距离偏差和速度偏差的时变协同控制律;其中,所述距离偏差表示两通讯列车之间的实际距离与期望安全距离之间的偏差,所述速度偏差表示两通讯列车之间的实时速度偏差。
[0028]
构建的时变协同控制律表示为:其中,ui(t)表示列车i的所受到的牵引力或者制动力;k1(t)、k2(t)均为待确定的时变协同控制增益,分别对应距离偏差增益、速度偏差增益,且数值均动态变化,即随着时间状态的变化而动态变化;a
ij
为列车i与列车j的通信关系系数,如果存在通信,a
ij
为1,否则a
ij
为0,且;vi(t)、vj(t)分别表示列车i、列车j的实时速度;xi(t)、xj(t)分别表示列车i、列车j的实时位置,n为多列车协同系统中的列车总数,d为给定的两车之间期望安全距离,t表示时间。
[0029]
步骤3:将列车实时的距离偏差和速度偏差输入训练好的神经网络,获得实时的全局最优的时变协同控制增益。
[0030]
本实施例中,选用的神经网络为bp神经网络,所述bp神经网络的训练步骤如下:s-1:初始化bp神经网络参数:输入层神经元个数为2,一个输入对应距离偏差,一个输入对应速度偏差;一层隐藏层,隐藏层的神经元个数取值为任意值;输出层神经元个数为2,对应距离偏差增益与速度偏差增益;链接权值初始化为(0,1)之间的任意值。
[0031]
s-2:从训练集中取某一训练样本,并输入所述bp神经网络。
[0032]
s-3:由bp神经网络正向计算出各层节点的输出。
[0033]
s-4:计算bp神经网络的实际输出和期望输出的误差。
[0034]
s-5:从输出层开始反向计算到第一个隐藏层,并采用梯度下降法向减少误差方向调整整个bp神经网络的各个连接权值。
[0035]
s-6:对所述训练集中的每个训练样本重复上述步骤s-2至s-5,直到对整个bp神经网络的误差达到预设要求。
[0036]
需要说明的是,bp神经网络的训练过程中选择的误差公式、梯度下降法均可以参照现有技术,因此,对其不进行具体的约束。本实施例优选参与训练的训练集是由经过多次状态采样得到的距离偏差和速度偏差、及对应的全局最优的时变协同控制增益构成的;其中,每一次通过状态采样得到的距离偏差、速度偏差后,利用布谷鸟搜索算法计算得到全局最优的时变协同控制增益,具体如下:步骤3.1:初始化设置布谷鸟搜索算法相关参数:鸟巢总数m,发现概率p∈[0,1],最大迭代次数n,以及n1个初始种群,,x1,x2,x3分别表示第1个、第2个、第n1个布谷鸟找的鸟巢位置,、分别表示第n1个布谷鸟找的鸟巢位置对应的距离偏差增益、速度偏差增益,n1为布谷鸟个数。
[0037]
其中,设定的目标函数为:
上述目标函数的公式中,前两项为多列车协同状态误差最小指标,最后一项为能耗指标。
[0038]
步骤3.2:按照如下规则更新种群中每一个鸟巢位置xi(t)。
[0039]
其中,通过莱维飞行到达一个新鸟巢位置后计算目标函数值,再将其与上一代鸟巢位置xi(t-1)的目标函数值比较,如果目标函数值变小,则替代更新鸟巢位置,否则保持原鸟巢位置不变;所述莱维飞行的公式如下:式中,α为步长,levy(β)为莱维随机路径,t对应迭代次数。
[0040]
步骤3.3:得到新种群的鸟巢位置xi(t)后,随机产生服从 0 到 1 均匀分布的数值r,并与发现概率p比较,如果r》p,则随机更新一次鸟巢位置xi(t),再计算鸟巢位置更新后的目标函数值,如果目标函数值更小,则替代更新原鸟巢位置,否则保持原鸟巢位置;如果r《或=p,则保持当前鸟巢位置。
[0041]
步骤3.4:排列找出当前所有鸟巢中的最优位置。
[0042]
步骤3.5:判断是否达到最大迭代次数,如是,输出最优位置,即得到代入的当前状态采样所对应的全局最优的时变协同控制增益中的距离偏差增益与速度偏差增益;如没有达到所述最大迭代次数,则循环步骤3.2-3.5直至达到所述最大迭代次数。
[0043]
其中,按照步骤3.1-3.5循环多次,代入所有状态采样,则可以得到不同状态采样所对应的全局最优协同增益,进而构建出所述训练集。
[0044]
步骤4:基于所述全局最优的时变协同控制增益得到所述时变协同控制律,再基于所述时变协同控制律,并利用列车的牵引制动系统以产生牵引力或制动力,进而控制各列车的加速度变化;其中,所述时变协同控制律具体表示为列车所受到的牵引力或者制动力。
[0045]
需要说明的是,本实施例中优选各列车获取自身以及通讯列车的实时运行信息和位置信息,从而得到全局最优的时变协同控制增益后,随后计算出时变协同控制律,再基于所述时变协同控制律,并利用列车的牵引制动系统以产生牵引力或制动力,进而控制各列车的加速度变化。其他可行的实施例中,也可以是各列车上处理中心统一上传实时运行信息和位置信息,再由各列车的控制器计算出时变协同控制律或者再由处理中心计算出时变协同控制律。即并不约束各个列车的信号如何输送,譬如各个列车的实时运行信息/位置信息可以直接反馈给其他列车,也可以反馈给控制中心,进而各个列车可以按照本发明的技术思路直接生成自身的控制变量,或者由控制中心生成各个列车的控制量并反馈给各个列车。
[0046]
实施例2:实施例1的实现过程可以理解为多列车协同控制系统的整体协同控制方法,按照本发明的技术思路,还能以每个列车的角度来实现本发明的技术思路,即每个列车获取自身的实时运行信息以及通讯列车的实时运行信息、位置信息。即对应所述多列车协同巡航
控制方法包括以下步骤:s1:当前列车获取自身及通讯列车的实时运行信息和位置信息。
[0047]
s2:引入时变协同控制增益,构建基于距离偏差和速度偏差的时变协同控制律;其中,所述时变协同控制增益包括距离偏差增益与速度偏差增益,且数值均动态变化;所述距离偏差表示两通讯列车之间的实际距离与期望安全距离之间的偏差,所述速度偏差表示量通讯列车之间的实时速度偏差。
[0048]
s3:将当前列车实时的距离偏差和速度偏差输入训练好的神经网络,获得实时的全局最优的时变协同控制增益。
[0049]
s4:基于所述全局最优的时变协同控制增益得到所述时变协同控制律,再基于所述时变协同控制律,并利用当前列车的牵引制动系统以产生牵引力或制动力,进而控制当前列车的加速度变化,其中,所述时变协同控制律具体表示为列车所受到的牵引力或者制动力。
[0050]
应当理解,上述具体实现过程以及优化手段可以参照实施例1的具体内容,在此不再赘述。
[0051]
实施例3:本实施例提供的一种基于所述多列车协同巡航控制方法的系统,其包括:多列车系统、运行信息采集子系统、列车通讯子系统以及控制子系统;所述多列车系统由多辆列车构成;所述运行信息采集子系统由各列车的车载设备和/或轨旁设备构成,用于采集各个列车的实时运行信息;所述列车通讯子系统由各列车的通讯模块和/或无线闭塞中心构成,用于构建列车之间的通讯连接,实现通讯列车之间的信息输送;述控制子系统由各个列车的控制器构成,用于根据步骤2-步骤4或者根据步骤s2-步骤s4得到或获取各个列车的时变协同控制律,并作用于列车的牵引制动系统以产生牵引力或制动力,进而控制列车的加速度变化。
[0052]
需要说明的是,在一些实现过程中,由各个列车的控制器来根据步骤2-步骤4或者根据步骤s2-步骤s4得到各个列车的控制变量,进而产生相应的牵引力或制动力;在另一些实现过程中,由控制中心根据步骤2-步骤4或者根据步骤s2-步骤s4得到各个列车的控制变量,进而反馈给各个列车的控制器,再作用于列车的牵引制动系统以产生牵引力或制动力。
[0053]
实施例4:本实施例提供的一种电子终端,其包括:一个或多个处理器;以及存储了一个或多个计算机程序的存储器;其中,所述处理器调用所述计算机程序以实现:一种在线实时优化多列车协同巡航控制方法的步骤。具体是实现:步骤1:获取列车的实时运行信息和位置信息;其中,各列车获取自身和通信相邻列车的实时运行位置信息和位置信息;步骤2:引入时变协同控制增益,构建基于距离偏差和速度偏差的时变协同控制律;其中,所述时变协同控制增益包括距离偏差增益与速度偏差增益,且数值均动态变化;所述距离偏差表示两通讯列车之间的实际距离与期望安全距离之间的偏差,所述速度偏差表示两通讯列车之间的实时速度偏差;步骤3:将列车实时的距离偏差和速度偏差输入训练好的神经网络,获得实时的全局最优的时变协同控制增益;
所述神经网络的输入为列车的距离偏差和速度偏差,输出为全局最优的时变协同控制增益;步骤4:基于所述全局最优的时变协同控制增益得到所述时变协同控制律,再基于所述时变协同控制律,并利用列车的牵引制动系统以产生牵引力或制动力,进而控制各列车的加速度变化;其中,所述时变协同控制律具体表示为列车所受到的牵引力或者制动力。
[0054]
或者具体实现:s1:当前列车获取自身及通讯列车的实时运行信息和位置信息;s2:引入时变协同控制增益,构建基于距离偏差和速度偏差的时变协同控制律;其中,所述时变协同控制增益包括距离偏差增益与速度偏差增益,且数值均动态变化;所述距离偏差表示两通讯列车之间的实际距离与期望安全距离之间的偏差,所述速度偏差表示量通讯列车之间的实时速度偏差;s3:将当前列车实时的距离偏差和速度偏差输入训练好的神经网络,获得实时的全局最优的时变协同控制增益;s4:基于所述全局最优的时变协同控制增益得到所述时变协同控制律,再基于所述时变协同控制律,并利用当前列车的牵引制动系统以产生牵引力或制动力,进而控制当前列车的加速度变化,其中,所述时变协同控制律具体表示为列车所受到的牵引力或者制动力。
[0055]
应当理解,具体实现过程参照实施例1-2的相关内容。本实施例的电子终端可以是安装于列车上的设备,用于生成列车的控制变量;也可以是与列车通讯的外部设备,用于生成各个列车的控制变量。
[0056]
该终端还包括:通信接口,用于与外界设备进行通信,进行数据交互传输。譬如与运行信息采集子系统的采集设备、其他列车的通讯模块之间通讯,以获取列车本身及其相邻列车的实时运行信息。
[0057]
其中,存储器可能包含高速ram存储器,也可能还包括非易失性除颤器,例如至少一个磁盘存储器。
[0058]
如果存储器、处理器和通信接口独立实现,则存储器、处理器和通信接口可以通过总线相互连接并完成相互间的通信。所述总线可以是工业标准体系结构总线,外部设备互联总线或扩展工业标准体系结构总线等。所述总线可以分为地址总线、数据总线、控制总线等。
[0059]
可选的,在具体实现上,如果存储器、处理器和通信接口集成在一块芯片上,则存储器、处理器即通信接口可以通过内部接口完成相互之间的通信。
[0060]
各个步骤的具体实现过程请参照前述方法的阐述。
[0061]
应当理解,在本发明实施例中,所称处理器可以是中央处理单元(central processing unit,cpu),该处理器还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据。存储器的一部分还可以包括非易失性随机存取存储器。例如,存储
器还可以存储设备类型的信息。
[0062]
实施例5:本实施例提供一种可读存储介质,其存储了计算机程序,所述计算机程序被处理器调用以实现:一种在线实时优化多列车协同巡航控制方法的步骤。
[0063]
其中,具体实现:步骤1:获取列车的实时运行信息和位置信息;其中,各列车获取自身和通信相邻列车的实时运行位置信息和位置信息;步骤2:引入时变协同控制增益,构建基于距离偏差和速度偏差的时变协同控制律;其中,所述时变协同控制增益包括距离偏差增益与速度偏差增益,且数值均动态变化;所述距离偏差表示两通讯列车之间的实际距离与期望安全距离之间的偏差,所述速度偏差表示两通讯列车之间的实时速度偏差;步骤3:将列车实时的距离偏差和速度偏差输入训练好的神经网络,获得实时的全局最优的时变协同控制增益;所述神经网络的输入为列车的距离偏差和速度偏差,输出为全局最优的时变协同控制增益;步骤4:基于所述全局最优的时变协同控制增益得到所述时变协同控制律,再基于所述时变协同控制律,并利用列车的牵引制动系统以产生牵引力或制动力,进而控制各列车的加速度变化;其中,所述时变协同控制律具体表示为列车所受到的牵引力或者制动力。
[0064]
或者具体实现:s1:当前列车获取自身及通讯列车的实时运行信息和位置信息;s2:引入时变协同控制增益,构建基于距离偏差和速度偏差的时变协同控制律;其中,所述时变协同控制增益包括距离偏差增益与速度偏差增益,且数值均动态变化;所述距离偏差表示两通讯列车之间的实际距离与期望安全距离之间的偏差,所述速度偏差表示量通讯列车之间的实时速度偏差;s3:将当前列车实时的距离偏差和速度偏差输入训练好的神经网络,获得实时的全局最优的时变协同控制增益;s4:基于所述全局最优的时变协同控制增益得到所述时变协同控制律,再基于所述时变协同控制律,并利用当前列车的牵引制动系统以产生牵引力或制动力,进而控制当前列车的加速度变化,其中,所述时变协同控制律具体表示为列车所受到的牵引力或者制动力。
[0065]
应当理解,具体实现过程参照实施例1-2的相关内容。
[0066]
所述可读存储介质为计算机可读存储介质,其可以是前述任一实施例所述的控制器的内部存储单元,例如控制器的硬盘或内存。所述可读存储介质也可以是所述控制器的外部存储设备,例如所述控制器上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。进一步地,所述可读存储介质还可以既包括所述控制器的内部存储单元也包括外部存储设备。所述可读存储介质用于存储所述计算机程序以及所述控制器所需的其他程序和数据。所述可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
[0067]
基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,
或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的可读存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。

技术特征:
1.一种在线实时优化多列车协同巡航控制方法,其特征在于,包括以下步骤:步骤1:获取列车的实时运行信息和位置信息;步骤2:引入时变协同控制增益,构建基于距离偏差和速度偏差的时变协同控制律;其中,所述时变协同控制增益包括距离偏差增益与速度偏差增益,且数值均动态变化;所述距离偏差表示两通讯列车之间的实际距离与期望安全距离之间的偏差,所述速度偏差表示两通讯列车之间的实时速度偏差;步骤3:将列车实时的距离偏差和速度偏差输入训练好的神经网络,获得实时的全局最优的时变协同控制增益;所述神经网络的输入为列车的距离偏差和速度偏差,输出为全局最优的时变协同控制增益;步骤4:基于所述全局最优的时变协同控制增益得到所述时变协同控制律,再基于所述时变协同控制律,并利用列车的牵引制动系统产生牵引力或制动力,进而控制各列车的加速度变化;其中,所述时变协同控制律具体表示为列车所受到的牵引力或者制动力。2.根据权利要求1所述的多列车协同巡航控制方法,其特征在于,步骤2中构建的时变协同控制律表示为:其中,u
i
(t)表示列车i的所受到的牵引力或者制动力;k1(t)、k2(t)均为待确定的时变协同控制增益,分别对应距离偏差增益、速度偏差增益;a
ij
为列车i与列车j的通信关系系数,如果存在通信,a
ij
为1,否则a
ij
为0,且,v
i
(t)、v
j
(t)分别表示列车i、列车j的实时速度;x
i
(t)、x
j
(t)分别表示列车i、列车j的实时位置,n为多列车协同系统中的列车总数,d为给定的两车之间期望安全距离,t表示时间。3.根据权利要求1所述的多列车协同巡航控制方法,其特征在于,所述步骤3中神经网络是基于训练集训练的,所述训练集是由经过多次状态采样得到的距离偏差和速度偏差、及对应的全局最优的时变协同控制增益构成的;其中,每一次通过状态采样得到的距离偏差、速度偏差后,利用布谷鸟搜索算法计算得到全局最优的时变协同控制增益,具体如下:步骤3.1:初始化设置布谷鸟搜索算法相关参数:鸟巢总数m,发现概率p∈[0,1],最大迭代次数n,以及n1个初始种群,,x1,x2,x3分别表示第1个、第2个、第n1个布谷鸟找的鸟巢位置,、分别表示第n1个布谷鸟找的鸟巢位置对应的距离偏差增益、速度偏差增益,n1为布谷鸟个数;步骤3.2:按照如下规则更新种群中每一个鸟巢位置;其中,通过莱维飞行到达一个新鸟巢位置后计算目标函数值,再将其与上一代鸟巢位置的目标函数值比较,如果目标函数值变小,则替代更新鸟巢位置,否则保持原鸟巢位置不变;所述莱维飞行的公式如下:
式中,α为步长,levy(β)为莱维随机路径,t对应迭代次数,x
i
(t)、x
i
(t-1)分别表示第i个布谷鸟在第t次迭代、第t-1次迭代找到的鸟巢位置;步骤3.3:得到新种群的鸟巢位置后,随机产生服从 0 到 1 均匀分布的数值r,并与发现概率p比较,如果r大于p,则随机更新一次鸟巢位置,再计算鸟巢位置更新后的目标函数值,如果目标函数值更小,则替代更新原鸟巢位置,否则保持原鸟巢位置;如果r小于或等于p,则保持当前鸟巢位置;步骤3.4:找出当前所有鸟巢中的最优位置,其中,目标函数值最小对应的鸟巢位置为最优位置;步骤3.5:判断是否达到最大迭代次数,如是,输出最优位置,即得到代入的当前状态采样所对应的全局最优的时变协同控制增益中的距离偏差增益与速度偏差增益;如没有达到所述最大迭代次数,则循环步骤3.2-3.5直至达到所述最大迭代次数;其中,按照步骤3.1-3.5循环多次,代入所有状态采样,则可以得到不同状态采样所对应的全局最优协同增益,进而构建出所述训练集。4.根据权利要求3所述的多列车协同巡航控制方法,其特征在于,所述目标函数的公式为:式中,j为所述目标函数,u
i
(t)表示列车i的所受到的牵引力或者制动力,对应构建的时变协同控制律;a
ij
为列车i与列车j的通信关系系数,如果存在通信,a
ij
为1,否则a
ij
为0,且;v
i
(t)、v
j
(t)别表示列车i、列车j的实时速度;x
i
(t)、x
j
(t)分别表示列车i、列车j的实时位置,n为多列车协同系统中的列车总数,d为给定的两车之间期望安全距离,t表示时间。5.根据权利要求1所述的多列车协同巡航控制方法,其特征在于:所述步骤3中的所述神经网络为bp神经网络,所述bp神经网络的训练步骤如下:s-1:初始化bp神经网络参数:输入层神经元个数为2,一个输入对应距离偏差,一个输入对应速度偏差;一层隐藏层,隐藏层的神经元个数取值为任意值;输出层神经元个数为2,对应距离偏差增益与速度偏差增益;链接权值初始化为(0,1)之间的任意值;s-2:从训练集中取某一训练样本,并输入所述bp神经网络;s-3:由bp神经网络正向计算出各层节点的输出;s-4:计算bp神经网络的实际输出和期望输出的误差;s-5:从输出层开始反向计算到第一个隐藏层,并采用梯度下降法向减少误差方向调整整个bp神经网络的各个连接权值;s-6:对所述训练集中的每个训练样本重复上述步骤s-2至s-5,直到对整个bp神经网络的误差达到预设要求。6.根据权利要求1所述的多列车协同巡航控制方法,其特征在于:步骤1是各列车获取
自身以及通讯列车的实时运行信息和位置信息。7.一种在线实时优化多列车协同巡航控制方法,其特征在于,应用于多列车协同控制系统的单列车,所述多列车协同巡航控制方法包括以下步骤:s1:当前列车获取自身及通讯列车的实时运行信息和位置信息;s2:引入时变协同控制增益,构建基于距离偏差和速度偏差的时变协同控制律;其中,所述时变协同控制增益包括距离偏差增益与速度偏差增益,且数值均动态变化;所述距离偏差表示两通讯列车之间的实际距离与期望安全距离之间的偏差,所述速度偏差表示量通讯列车之间的实时速度偏差;s3:将当前列车实时的距离偏差和速度偏差输入训练好的神经网络,获得实时的全局最优的时变协同控制增益;s4:基于所述全局最优的时变协同控制增益得到所述时变协同控制律,再基于所述时变协同控制律,并利用当前列车的牵引制动系统以产生牵引力或制动力,进而控制当前列车的加速度变化,其中,所述时变协同控制律具体表示为列车所受到的牵引力或者制动力。8.一种基于权利要求1-7任一项所述多列车协同巡航控制方法的系统,其特征在于,包括:多列车系统、运行信息采集子系统、列车通讯子系统以及控制子系统;所述多列车系统由多辆列车构成;所述运行信息采集子系统由各列车的车载设备和/或轨旁设备构成,用于采集各个列车的实时运行信息;所述列车通讯子系统由各列车的通讯模块和/或无线闭塞中心构成,用于构建列车之间的通讯连接,实现通讯列车之间的信息输送;所述控制子系统由各个列车的控制器构成,用于根据步骤2-步骤4或者根据步骤s2-步骤s4得到或获取各个列车的时变协同控制律,并作用于列车的牵引制动系统以产生牵引力或制动力,进而控制列车的加速度变化。9.一种电子终端,其特征在于:包括:一个或多个处理器;存储了一个或多个计算机程序的存储器;所述处理器调用所述计算机程序以实现:权利要求1-7任一项所述多列车协同巡航控制方法的步骤。10.一种可读存储介质,其特征在于:存储了计算机程序,所述计算机程序被处理器调用以实现:权利要求1-7任一项所述多列车协同巡航控制方法的步骤。

技术总结
本发明公开了一种在线实时优化多列车协同巡航控制方法及系统,该方法包括:计算每列列车与其相邻列车之间的距离偏差和速度偏差;引入时变协同控制增益,构建最优协同控制律;以最小化距离和速度偏差为目标,通过布谷鸟搜索算法计算当前状态的最优协同控制增益;进而通过多次采样计算构建距离和速度偏差状态和最优控制增益相对应的样本数据集并用于训练神经网络,在多列车实际运行时通过神经网络实时在线获取最优协同控制增益。本发明所述方法通过设计时变协同控制增益,根据状态变化在线实时优化多列车协同控制律,促使列车间以最快速度稳定到一致状态,提升了多列车协同巡航的收敛速度,并减小了瞬时超调量,满足了列车安全高效运行的需求。全高效运行的需求。全高效运行的需求。


技术研发人员:王根达 杨迎泽 周峰 黄志武 彭军
受保护的技术使用者:中南大学
技术研发日:2022.12.29
技术公布日:2023/1/31
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐