一种分布式深度学习的列车应急驾驶控制方法

未命名 07-02 阅读:90 评论:0


1.本发明涉及交通运输技术领域,特别是一种分布式深度学习的列车应急驾驶控制方法。


背景技术:

2.在列车运营过程中,不可避免地会因地面信号设备故障、气候、线路塌方和落物入侵等各种原因,造成列车停车。从而导致线路被长时间占用,降低了线路利用率,并造成经济损失。
3.由于上述突发情况是随机产生的,列车可能会在站点间任何地方临时停车。此时,原有的列车自动驾驶速度曲线已不再适用,需要重新规划出列车自动驾驶速度曲线或操纵档位序列,以实现最佳的行车指导。而现有采用遗传、粒子群等智能计算方式,都需要通过不断迭代,此过程耗时长,降低了线路利用率,并减少乘客旅行体验感。
4.现有技术中,也可结合数据驱动、机器学习方式,建立机器学习模型来实时地实现列车自动驾驶速度曲线预测或应急操纵。然而,对于某一运营公司而言,上述突发情况是一个小概率事件,发生情况并不多。我们从列车运行监控装置、列车控制与管理系统设备上能够获取的列车应急驾驶标注数据较少,若采用某运营公司的单线小样本数据来训练深度学习模型,用训练好的模型来实现应急走行驾驶控制,其控制精度很低,严重限制了采用机器学习方法的预测与控制效果,将导致无法实际应用。
5.另一方面,截至2021年11月,我国50座城市诞生99家城轨运营公司,这些轨道运营公司并不是每家都开放的,公司之间没有采用可靠的数据共享方案,来实现列车运行数据的共享,从而造成了列车运营数据价值的严重浪费。


技术实现要素:

6.针对背景技术的问题,本发明提供一种分布式深度学习的列车应急驾驶控制方法,以解决现有技术中如何利用小样本数据解决列车应急自动驾驶的精确控制,提高救援效率的问题。
7.为实现本发明的目的,本发明提供了一种分布式深度学习的列车应急驾驶控制方法,其创新点在于:包括列控中心和n个运营商服务器,单个运营商服务器存储有所辖运营线路对应的样本数据库,单个样本数据库包括多个列车应急驾驶样本数据;将单个运营服务器记为一个工作节点,n个工作节点两两依次通信连接形成环形网络拓扑结构,单个工作节点有两个邻居工作节点;所述控制方法包括:
8.首先,各个运营商服务器均采用生成对抗网络gan的方法,对各自的样本数据库中列车应急驾驶样本数据的数量进行扩充,得到对应的增强样本数据库;
9.然后,采用方法一构建应急驾驶深度学习模型;
10.当某个列车因突发情况应急停车后,所述列车向列控中心发送应急驾驶请求;列控中心收到所述应急驾驶请求后通知对应的运营商服务器,运营商服务器收到通知后将所
述应急驾驶深度学习模型下发给列车,列车利用应急驾驶深度学习模型实时生成操控档位控制列车运行;
11.所述方法一包括:
12.1)各个工作节点分别利用深度神经网络构建一个初始深度学习模型;
13.2)每个工作节点均按方法二对对应的初始深度学习模型进行训练,以获取对应的成熟深度学习模型;每个工作节点均将对应的成熟深度学习模型的模型参数发送给列控中心的服务器;
14.3)当列控中心的服务器收到全部工作节点的所述模型参数后,根据公式三进行处理得到综合的深度学习模型参数w
p
,根据综合的深度学习模型参数w
p
构建的深度学习模型即为应急驾驶深度学习模型;然后列控中心的服务器将应急驾驶深度学习模型下发到各个工作节点;
15.所述方法二包括:
16.将n个工作节点中的任意一个工作节点记为工作节点k,设工作节点k对应的深度学习模型的模型参数为采用公式一对模型参数进行t-1次迭代更新后得到的深度学习模型即为工作节点k对应的成熟深度学习模型,工作节点k的成熟深度学习模型对应的模型参数记为
17.所述公式一为:
[0018][0019]
其中,t为迭代更新的次数,t为1到t-1的整数,t为设置值;为从工作节点k对应的增强样本数据库中随机抽取的样本数据;为基于计算的随机梯度;η为学习率;为邻居组合参数,根据公式二获取;
[0020]
所述公式二为:
[0021][0022]
其中,工作节点kj为与工作节点k相邻的工作节点,j取值为1或2,w
k1
和w
k2
分别为工作节点k与两个相邻工作节点的网络通信的权重矩阵,;为第t次更新时,与工作节点k相邻工作节点的模型参数;
[0023]
所述公式三为:
[0024][0025]
进一步地,所述步骤1)中所述深度神经网络为卷积神经网络cnn或长短期记忆神经网络lstm。
[0026]
进一步地,根据所述列车应急驾驶样本数据提取的用于深度学习模型训练的输入特征包括:列车参数,列车定位、列车应急走行时间、线路坡度、线路限速值;深度学习模型训练的输出特征包括:列车工况转换点位置及对应的操纵档位。
[0027]
本发明的原理如下:
[0028]
列车的应急自动驾驶是一个小概率事件,能获取的带标签的数据量不多。对于某
一运营公司而言,用小样本数据所训练出的深度学习模型,来实现应急自动驾驶控制,其控制精度很低,严重限制了深度学习的预测与控制效果,将导致无法实际应用。
[0029]
本发明创新性地提出了数据“二次增强”以及分布式深度学习的发明构思,通过上述发明构思构建深度学习模型应用于列车应急自动驾驶控制。
[0030]
首先,采用生成对抗网络gan对应急驾驶样本数据的数量进行扩充,实现数据“一次增强”,从而得到增强样本数据库用于后续深度学习模型训练。
[0031]
其次,提出了一种分布式深度学习模型的列车自动驾驶计算实现框架,将运营商服务器作为节点,节点之间构建环形网络拓扑结构相互通信,协同训练。训练中,每个工作节点在每次迭代时需要两方面的输入:一是在当前模型基础上根据本地样本数据计算出来的梯度,二是来自邻接节点的模型参数,通过各个节点相互之间样本数据共享,实现了数据的“二次增强”。而且,相邻节点之间仅进行模型参数交换而非数据交换,列车驾驶数据本身不离开本地运营商,在一定程度上实现了对数据的加密。由此可见,通过本技术所述的分布式深度学习数据共享系统不仅打通各个运营商之间的数据孤岛,整合各个运营商的数据,解决了列车应急驾驶样本数据少的问题,同时使各个运营商的列车应急驾驶数据本身在一定程度上得到保护,更加促进各个运营商之间的合作积极性。
[0032]
事实上,以上这种去中心化的分布式学习模式还解决了中心化学习模式存在的弊端:中心化模式容易在中心节点处形成瓶颈,在网络连接比较差时尤为明显;中心化学习模式要求中心节点能够稳定地聚合和分发模型,一旦中心节点出错,整个任务将会失败,因此对系统的稳定性要求很高。而这种去中心化分布式模式让每个工作节点具有更多的自主性,模型的定期维护和更新更加分散化;由于去中心化分布式模式需要的网络通信代价较小,其效率更高,整体表现更好。同时,该去中心化分布式学习模式易于节点数量的增加,可定期补充节点,而且,当某运营商列车应急驾驶样本数据积累到一定程度,也可方便地对模型进行更新,进一步增强模型的性能。
[0033]
由此可见,本发明具有如下的有益效果:采用本发明所述的控制方法,能在整合多个运营商的列车应急驾驶样本数据,通过数据二次增强,训练出性能和精确性都更好的深度学习模型,提高列车应急自动驾驶曲线或档位操控序列的质量,从而提高列车应急救援的效率和应急驾驶控制精度。
具体实施方式
[0034]
下面结合实施例对本发明作进一步说明。
[0035]
本实施例所述的分布式深度学习的列车应急驾驶控制方法涉及的硬件包括列控中心和n个运营商服务器,单个运营商服务器存储有所辖运营线路对应的样本数据库,单个样本数据库包括多个列车应急驾驶样本数据;将单个运营服务器记为一个工作节点,n个工作节点两两依次通信连接形成环形网络拓扑结构,单个工作节点有两个邻居工作节点;所述控制方法包括:
[0036]
首先,各个运营商服务器均采用生成对抗网络gan的方法,对各自的样本数据库中列车应急驾驶样本数据的数量进行扩充,得到对应的增强样本数据库。gan同时训练两个模型:一个可以用来发现数据分布规律的产生式模型;另一个用来区分真实样本和生成数据的判别式模型。具体地,由gan网络的生成器生成列车应急驾驶速度曲线轨迹,即生成假样
本。将获取的真实小样本应急驾驶速度曲线数据样本和由生成网络生成的应急驾驶速度曲线样本输入判别模型中,该模型将对给定样本进行真假标记。采用最大最小交替化的策略训练gan:一方面,最小化生成器的损失,使其可以生成更为逼真的样本;另一方面,最大化判别器的损失,使其无法判断给定的样本是来自真实数据还是生成数据。这样,生成器能够产生“足够真”的生成样本,实现数据增强,从而得到更多的列车应急驾驶样本数据,实现样本数据库增强。
[0037]
然后,采用方法一构建应急驾驶深度学习模型;
[0038]
当某个列车因突发情况应急停车后,所述列车向列控中心发送应急驾驶请求;列控中心收到所述应急驾驶请求后通知对应的运营商服务器,运营商服务器收到通知后将所述应急驾驶深度学习模型下发给列车,列车利用应急驾驶深度学习模型实时生成操控档位控制列车运行;
[0039]
所述方法一包括:
[0040]
1)各个工作节点分别利用深度神经网络构建一个初始深度学习模型;本实施例中,可选择现有技术中常见的卷积神经网络cnn或长短期记忆神经网络lstm等神经网络来构建初始的深度学习模型;
[0041]
2)每个工作节点均按方法二对对应的初始深度学习模型进行训练,以获取对应的成熟深度学习模型;每个工作节点均将对应的成熟深度学习模型的模型参数发送给列控中心的服务器;
[0042]
3)当列控中心的服务器收到全部工作节点的所述模型参数后,根据公式三进行处理得到综合的深度学习模型参数w
p
,根据综合的深度学习模型参数w
p
构建的深度学习模型即为应急驾驶深度学习模型;然后列控中心的服务器将应急驾驶深度学习模型下发到各个工作节点;
[0043]
所述方法二包括:
[0044]
将n个工作节点中的任意一个工作节点记为工作节点k,设工作节点k对应的深度学习模型的模型参数为采用公式一对模型参数进行t-1次迭代更新后得到的深度学习模型即为工作节点k对应的成熟深度学习模型,工作节点k的成熟深度学习模型对应的模型参数记为
[0045]
所述公式一为:
[0046][0047]
其中,t为迭代更新的次数,t为1到t-1的整数,t为设置值;为从工作节点k对应的增强样本数据库中随机抽取的样本数据;为基于计算的随机梯度;η为学习率;为邻居组合参数,根据公式二获取;
[0048]
所述公式二为:
[0049][0050]
其中,工作节点kj为与工作节点k相邻的工作节点,j取值为1或2,w
k1
和w
k2
分别为工作节点k与两个相邻工作节点的网络通信的权重矩阵,;为第t次更新时,与工作节点k
相邻工作节点的模型参数;
[0051]
所述公式三为:
[0052][0053]
本实施例中,为了提高深度学习模型的训练效果,可从列车应急驾驶样本数据中提取以下特征作为深度学习模型训练的输入特征:列车参数,列车定位、列车应急走行时间、线路坡度、线路限速值;深度学习模型训练的输出特征包括:列车工况转换点位置及对应的操纵档位。
[0054]
当各运营商服务器中列车应急驾驶样本数据积累到一定程度,可重新按照上述步骤进行模型训练,对模型进行更新。也可通过增加新的运营商服务器的方式对模型进行更新:只需要对距离新增工作节点最近的相邻两个工作节点进行拆解后,使新增工作节点建立与两个节点的通信连接,即将新的运营商服务器加入环形通信网络拓扑结构中,重新进行模型训练即可。
[0055]
本发明中应用到的生成对抗网络gan、卷积神经网络cnn、长短期记忆神经网络lstm等理论均为现有技术中十分常见的处理手段或计算方法,相关的内容,本领域技术人员可从现有技术的相关文献中获取。

技术特征:
1.一种分布式深度学习的列车应急驾驶控制方法,其特征在于:包括列控中心和n个运营商服务器,单个运营商服务器存储有所辖运营线路对应的样本数据库,单个样本数据库包括多个列车应急驾驶样本数据;将单个运营服务器记为一个工作节点,n个工作节点两两依次通信连接形成环形网络拓扑结构,单个工作节点有两个邻居工作节点;所述控制方法包括:首先,各个运营商服务器均采用生成对抗网络gan的方法,对各自的样本数据库中列车应急驾驶样本数据的数量进行扩充,得到对应的增强样本数据库;然后,采用方法一构建应急驾驶深度学习模型;当某个列车因突发情况应急停车后,所述列车向列控中心发送应急驾驶请求;列控中心收到所述应急驾驶请求后通知对应的运营商服务器,运营商服务器收到通知后将所述应急驾驶深度学习模型下发给列车,列车利用应急驾驶深度学习模型实时生成操控档位控制列车运行;所述方法一包括:1)各个工作节点分别利用深度神经网络构建一个初始深度学习模型;2)每个工作节点均按方法二对对应的初始深度学习模型进行训练,以获取对应的成熟深度学习模型;每个工作节点均将对应的成熟深度学习模型的模型参数发送给列控中心的服务器;3)当列控中心的服务器收到全部工作节点的所述模型参数后,根据公式三进行处理得到综合的深度学习模型参数w
p
,根据综合的深度学习模型参数w
p
构建的深度学习模型即为应急驾驶深度学习模型;然后列控中心的服务器将应急驾驶深度学习模型下发到各个工作节点;所述方法二包括:将n个工作节点中的任意一个工作节点记为工作节点k,设工作节点k对应的深度学习模型的模型参数为采用公式一对模型参数进行t-1次迭代更新后得到的深度学习模型即为工作节点k对应的成熟深度学习模型,工作节点k的成熟深度学习模型对应的模型参数记为所述公式一为:其中,t为迭代更新的次数,t为1到t-1的整数,t为设置值;为从工作节点k对应的增强样本数据库中随机抽取的样本数据;为基于计算的随机梯度;η为学习率;为邻居组合参数,根据公式二获取;所述公式二为:其中,工作节点kj为与工作节点k相邻的工作节点,j取值为1或2,w
k1
和w
k2
分别为工作节点k与两个相邻工作节点的网络通信的权重矩阵,;为第t次更新时,与工作节点k相邻工作节点的模型参数;
所述公式三为:2.如权利要求1所述的分布式深度学习的列车应急驾驶控制方法,其特征在于:所述步骤1)中所述深度神经网络为卷积神经网络cnn或长短期记忆神经网络lstm。3.如权利要求1或2所述的分布式深度学习的列车应急驾驶控制方法,其特征在于:根据所述列车应急驾驶样本数据提取的用于深度学习模型训练的输入特征包括:列车参数,列车定位、列车应急走行时间、线路坡度、线路限速值;深度学习模型训练的输出特征包括:列车工况转换点位置及对应的操纵档位。

技术总结
本发明提供了一种分布式深度学习的列车应急驾驶控制方法,其特征在于:包括列控中心和n个运营商服务器;所述控制方法包括:各个运营服务器通过GAN的方法对样本数据增强,n个运营商服务器以工作节点组成环形网络拓扑结构,各个工作节点按分布式深度学习方式构建应急驾驶深度学习模型,列车利用应急驾驶深度学习模型实时生成操控档位进行应急驾驶控制。采用本申请的控制方法能在整合多个运营商的列车应急驾驶样本数据,训练出性能和精确性都更好的深度学习模型,提高列车高列车应急救援的效率和应急驾驶控制精度。率和应急驾驶控制精度。


技术研发人员:徐凯 孟倩倩 吴仕勋 杨建喜 蓝章礼 张皓桐 许仕壮
受保护的技术使用者:重庆交通大学
技术研发日:2023.01.03
技术公布日:2023/5/26
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐