列车虚拟编组运行控制方法及装置与流程
未命名
07-02
阅读:131
评论:0

1.本公开涉及列车控制技术领域,尤其提供一种列车虚拟编组运行控制方法及装置。
背景技术:
2.虚拟编组(virtual coupling,vc)是指列车之间通过无线通信传输状态信息,从而通过先进控制方法使得两车或多车保持速度趋同,间距缩短达到类似车车之间通过实际物理车钩连挂的效果。虚拟编组高效灵活的编组方式在应对城市轨道交通客流运能时空不匹配等问题具有较大优势,同时有较大潜力降低运营成本,是未来轨道交通热门的发展方向之一。
3.面向我国轨道交通自动驾驶中运行环境多变、运营条件复杂等特点与难点,亟待提高列车运行控制的智能化程度。基于人工智能(artificial intelligence,ai)的列车自动驾驶(automatic train operation,ato)智能控制算法,在学习优秀司机驾驶操纵模式、泛化对未知状态的适应能力等方面具有很大的优势,能够帮助解决列车虚拟编组复杂控制问题,推动虚拟编组技术的发展。然而,目前基于模型的控制器受限于模型建模困难,模型约束复杂,无模型控制器调优过程成本高、费时费力。
技术实现要素:
4.本公开提供了一种列车虚拟编组运行控制方法及装置。
5.根据本公开的第一方面,提供了一种列车虚拟编组运行控制方法,包括:
6.构建被控对象列车模型;
7.基于被控对象列车模型,结合实际运行控制系统的功能搭建仿真学习训练环境;
8.基于ai的列车虚拟编组运行控制算法架构,基于虚拟编组的控制目标设计ato算法的奖励函数;
9.基于仿真学习训练环境和控制算法架构,设计被控对象列车的动作,对ato算法离线训练;
10.将训练后的ato算法集成至列车ato模块,控制列车运行。
11.在第一方面的一些实现方式中,构建被控对象列车模型包括:
12.对被控对象列车构建神经网络动力学模型;
13.基于车载ato的历史数据库对神经网络动力学模型进行离线训练学习。
14.在第一方面的一些实现方式中,还包括:基于被控对象列车模型,结合列车运行控制系统的功能搭建仿真学习训练环境包括:
15.基于被控对象列车模型,结合列车运行控制系统相关功能需求,搭建列车运行控制仿真平行系统/数字孪生系统,以便当ato算法输出的列车动作指令时,被控对象列车根据动作指令执行对应动作。
16.在第一方面的一些实现方式中,控制算法包括:q-learning、dqn、dpg、ddpg中的一
个。
17.在第一方面的一些实现方式中,基于虚拟编组的控制目标设计ato算法的奖励函数包括:
18.通过量化速度跟随各效果指标的情况设计ato算法的奖励函数。
19.在第一方面的一些实现方式中,通过量化速度跟随各效果指标的情况设计ato算法的奖励函数包括:
20.根据需求分别判断各效果指标的重要程度;
21.根据各效果指标的重要程度设置各效果指标的权重;
22.通过量化速度跟随各效果指标的情况,并结合各效果指标的权重设计ato算法的奖励函数。
23.在第一方面的一些实现方式中,控制列车运行包括:
24.根据列车感知系统采集的列车状态信息和车车通信获取领航列车的状态信息作为ato算法的输入,输出列车的期望控制量;
25.根据列车的期望控制量施加相应的牵引力和/或制动力,控制列车运行;
26.重复上述步骤直至驾驶任务结束。
27.根据本公开的第二方面,提供了一种列车虚拟编组运行控制装置,包括:
28.建模单元,用于构建被控对象列车模型;
29.学习单元,用于基于被控对象列车模型,结合实际运行控制系统的功能搭建仿真学习训练环境;
30.算法调整单元,用于基于ai的列车虚拟编组运行控制算法架构,基于虚拟编组的控制目标设计ato算法的奖励函数;
31.训练单元,用于基于仿真学习训练环境和控制算法架构,设计被控对象列车的动作,对ato算法离线训练;
32.控制单元,用于将训练后的ato算法集成至列车ato模块,控制列车运行。
33.根据本公开的第三方面,提供了一种电子设备。该电子设备包括:存储器和处理器,存储器上存储有计算机程序,处理器执行程序时实现如以上的方法。
34.根据本公开的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,程序被处理器执行时实现如根据本公开的第一方面的方法。
35.本公开构建被控对象模型,基于被控对象模型和ai算法架构设计基于强化学习的列车智能ato控制算法,如此,基于人工智能ai的列车自动驾驶智能控制算法,在学习优秀司机驾驶操纵模式、泛化对未知状态的适应能力等方面具有很大的优势,能够帮助解决列车虚拟编组复杂控制问题,推动虚拟编组技术的发展。采用训练后的ato算法对列车进行智能自动驾驶控车运行,实现列车高效、安全、稳定、鲁棒的运行控制。
36.应当理解,发明内容部分中所描述的内容并非旨在限定本公开的实施例的关键或重要特征,亦非用于限制本公开的范围。本公开的其它特征将通过以下的描述变得容易理解。
附图说明
37.结合附图并参考以下详细说明,本公开各实施例的上述和其他特征、优点及方面
将变得更加明显。附图用于更好地理解本方案,不构成对本公开的限定。在附图中,相同或相似的附图标记表示相同或相似的元素,其中:
38.图1是本公开实施例提供的一种列车虚拟编组运行控制方法的流程图;
39.图2是本公开实施例提供的一种基于神经网络动力学模型示意图;
40.图3是本公开实施例提供的一种仿真系统与现实系统交互示意图;
41.图4是本公开实施例提供的一种ddpg算法示意图;
42.图5是本公开实施例提供的一种ato算法的训练装置的示意图;
43.图6是本公开实施例提供的一种示例性电子设备的方框图。
具体实施方式
44.为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例,都属于本公开保护的范围。
45.另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
46.针对传统基于模型的控制器受限于模型建模困难以及模型约束复杂,无模型控制器调优过程成本高、费时费力等问题,本公开提出一种ato算法的训练方法、列车虚拟编组运行控制方法及装置,实现列车虚拟编组速度跟驰、间距保持、节能等多目标优化控制,增强列车ato控制算法自适应和泛化能力,提升控制算法的鲁棒性。
47.图1是本公开实施例提供的一种列车虚拟编组运行控制方法的流程图。
48.如图1所示,列车虚拟编组运行控制方法100包括:
49.s101:构建被控对象列车模型。
50.在s101中,构建被控对象列车模型包括:
51.对被控对象列车构建神经网络动力学模型;
52.基于车载ato的历史数据库对神经网络动力学模型进行离线训练学习。
53.可以理解的是,列车的神经网络动力学模型是进行离线学习的基础。可以选择数据驱动或数据和知识双驱动的机器学习方法,对列车的动力学特性进行仿真建模,作为强化学习中智能体即列车执行动作(加速/减速)之后状态转移的重要依据。
54.图2是本公开实施例提供的一种基于神经网络动力学模型示意图。
55.如图2所示,本公开列举其中一种基于数据驱动的机器学习列车动力学模型,并根据车载历史数据进行离线训练学习的实施案例。选取若干连续周期列车的速度、加速度、坡度、级位、载重等(剔除坏值的)数据信息作为神经网络模型的输入,选取列车的下一周期速度作为神经网络动力学模型的输出,中间隐含层的层数和神经元的个数根据实际需要调整。车载ato通用控制历史数据经过筛选和清洗后形成标准列车动力学历史数据库,基于历史数据库对机器学习动力学模型进行离线训练学习。
56.根据本公开的实施例,基于神经网络动力学模型学习自动驾驶,使智能控制算法在学习优秀司机驾驶操纵模式、泛化对未知状态的适应能力等方面具有很大的优势,能够
帮助解决列车虚拟编组复杂控制问题。
57.s102:基于被控对象列车模型,结合实际运行控制系统的功能搭建仿真学习训练环境;
58.在s102中,还包括:基于被控对象列车模型,结合列车运行控制系统的功能搭建仿真学习训练环境包括:
59.基于被控对象列车模型,结合列车运行控制系统相关功能需求,搭建列车运行控制仿真平行系统/数字孪生系统,以便当ato算法输出的列车动作指令时,被控对象列车根据动作指令执行对应动作。
60.图3是本公开实施例提供的一种仿真系统与现实系统交互示意图。
61.如图3所示,人工仿真系统利用现实系统产生的运行数据,构建神经网络拟合仿真实际运行控制系统;仿真系统利用搭建的仿真环境训练ai制动控制算法,将训练好的算法集成至实际控制系统中控制实际被控对象。
62.基于s101的实现列车动力学模块的仿真,结合列车运行控制系统相关功能需求,搭建列车运行控制仿真平行系统/数字孪生系统。该系统能够响应ai控制算法模块输出的列车动作(加速、减速和惰行)指令时,根据控制指令输出在该状态下执行该动作的状态转移。即
63.s
t+1
←st
(a
t
)(1)
64.式中s
t+1
表示列车t+1周期时刻的状态,s
t
表示列车t周期的状态,a
t
表示列车在t周期时刻被控列车施加的动作。其中状态信息表明列车当前所处的运行状态,是控制器在控制决策时所综合考虑的信息,一般的,应包含线路信息(如坡度、限速等)、列车属性信息(如最大牵引、最大制动等)、列车当前的运行状态信息(如速度、加速度等)以及对于虚拟编组运行控制需要的前车运行状态信息(如前车速度、与前车的相对距离等)。
65.根据本公开的实施例,结合列车运行控制系统相关功能需求,搭建列车运行控制仿真平行系统/数字孪生系统,使神经网络动力学模型能够根据功能需求进行强化学习,准确输出动作指令,提高列车运行安全性。
66.s103:基于ai的列车虚拟编组运行控制算法架构,基于虚拟编组的控制目标设计ato算法的奖励函数;
67.在s103中,控制算法包括:q-learning、dqn、dpg、ddpg中的一个。
68.目前,常用的强化学习算法有q-learning、dqn、dpg等。可以理解的是,本公开可以根据实际的硬件条件和功能需求,明确其中一种算法作为列车虚拟编组运行控制算法的架构。
69.图4是本公开实施例提供的一种ddpg算法示意图。
70.如图4所示,本公开列举其中一种适用于列车控制级位连续的强化学习算法ddpg(deep deterministic policy gradient),采用actor-critic架构,包含策略网络和q网络以及其对应的目标神经网络。actor根据策略网络生成动作附加探索噪声作为列车的运行控制指令,仿真环境根据控制指令获得奖励值r
t
和新的状态s
t+1
,actor将状态转移过程(s
t
,a
t
,r
t
,s
t+1
)存入到经验回放缓存中。之后从缓存区中随机采样n个状态转移更新策略网络和q网络,随后用软更新的方式更新目标策略网络和目标q网络。
71.根据本公开的实施例,采用目前常见的算法作为ai的列车虚拟编组运行的控制算
法,无需构建新的算法结构,在满足硬件需求和功能需求的同时便于训练,提高ato算法的训练效率。
72.在s103中,基于虚拟编组的控制目标设计ato算法的奖励函数包括:
73.通过量化速度跟随各效果指标的情况设计ato算法的奖励函数。
74.列车运行控制存在一些必须满足的运营指标,这些指标可以通过设置惩罚项来优化控制器的控制性能,如需要保证安全性(不超过atp限速,超过限速之后设计较大的惩罚项)、停车精度(
±
30cm,停车误差超过
±
30cm之后设计一个较大惩罚项)、准时性(列车晚点2分钟后,视运营需求,设计较大的惩罚项)、编队列车前后进站间隔(
±
5s,当进站间隔不满足要求后设计较大的惩罚项)等。
75.根据本公开的实施例,为ato算法设计奖励函数,使ato算法的输出更符合各效果指标的要求,从而满足被控对象控制需要。
76.在一些实施例中,通过量化速度跟随各效果指标的情况设计ato算法的奖励函数包括:
77.根据需求分别判断各效果指标的重要程度;
78.根据各效果指标的重要程度设置各效果指标的权重;
79.通过量化速度跟随各效果指标的情况,并结合各效果指标的权重设计ato算法的奖励函数。
80.列车虚拟编组运行控制过程主要控制目标是速度跟随和间距保持,通过量化速度跟随控制效果指标和间距保持效果指标,不同评价指标根据需求设置不同的权重来区分不同效果指标之间的重要程度,可通过加权平均的方式作为强化学习的奖励函数。
81.根据本公开的实施例,根据权重来区分不同效果指标之间的重要程度,使ato算法量化速度跟随各效果指标的情况更符合被控对象的实际运行,实现列车高效、安全、稳定、鲁棒的运行控制。
82.s104:基于仿真学习训练环境和控制算法架构,设计被控对象列车的动作,对ato算法离线训练。
83.根据上述选取的强化学习算法架构结合训练环境,对基于强化学习的ato控制算法进行离线训练。不同的强化学习算法训练步骤和训练时长有一定出入。以上述ddpg算法的训练流程为例,具体步骤包括:
84.[0085][0086]
s105:将训练后的ato算法集成至列车ato模块,控制列车运行;
[0087]
根据列车感知系统采集的列车状态信息和车车通信获取领航列车的状态信息作为ato算法的输入,输出列车的期望控制量;
[0088]
根据列车的期望控制量施加相应的牵引力和/或制动力,控制列车运行;
[0089]
重复上述步骤直至驾驶任务结束。
[0090]
根据本公开的实施例,根据列车实际情况反复输入状态信息及输出期望控制量,并进行对应的控制,直至驾驶任务结束,如此,由于训练后的ato算法满足列车的驾驶操纵模式及虚拟编组需要,因此采用训练后的ato算法进行驾驶,并根据列车的期望控制量施加相应的牵引力和/或制动力,可以在保证列车安全的同时实现列车的自动驾驶。
[0091]
综上所述,本公开针对传统基于模型的控制器受限于模型建模困难以及模型约束复杂等问题,基于无模型的控制器调优过程成本高、费时费力问题,本公开训练后的ato算法实现了列车高效、安全、稳定、鲁棒的运行控制。本公开基于数据驱动构建被控对象模型,基于被控对象模型和ai算法架构设计基于强化学习的列车智能ato控制算法,对列车进行智能自动驾驶控车运行。本公开基于人工智能ai的列车自动驾驶智能控制算法,在学习优秀司机驾驶操纵模式、泛化对未知状态的适应能力等方面具有很大的优势,能够帮助解决列车虚拟编组复杂控制问题,推动虚拟编组技术的发展。
[0092]
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本公开并不受所描述的动作顺序的限制,因为
依据本公开,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本公开所必须的。
[0093]
以上是关于方法实施例的介绍,以下通过装置实施例,对本公开所述方案进行进一步说明。
[0094]
图5是本公开实施例提供的一种列车虚拟编组运行控制装置的示意图;
[0095]
如图5所示,本公开提供了一种列车虚拟编组运行控制装置500,包括:
[0096]
建模单元501,用于构建被控对象列车模型;
[0097]
学习单元502,用于基于被控对象列车模型,结合实际运行控制系统的功能搭建仿真学习训练环境;
[0098]
算法调整单元503,用于基于ai的列车虚拟编组运行控制算法架构,基于虚拟编组的控制目标设计ato算法的奖励函数;
[0099]
训练单元504,用于基于仿真学习训练环境和控制算法架构,设计被控对象列车的动作,对ato算法离线训练;
[0100]
控制单元505,用于将训练后的ato算法集成至列车ato模块,控制列车运行。
[0101]
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,所述描述的模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0102]
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
[0103]
图6示出了可以用来实施本公开的实施例的电子设备600的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
[0104]
设备600包括计算单元601,其可以根据存储在只读存储器(rom)602中的计算机程序或者从存储单元608加载到随机访问存储器(ram)603中的计算机程序,来执行各种适当的动作和处理。在ram 603中,还可存储设备600操作所需的各种程序和数据。计算单元601、rom 602以及ram 603通过总线604彼此相连。输入/输出(i/o)接口605也连接至总线604。
[0105]
设备600中的多个部件连接至i/o接口605,包括:输入单元606,例如键盘、鼠标等;输出单元607,例如各种类型的显示器、扬声器等;存储单元608,例如磁盘、光盘等;以及通信单元609,例如网卡、调制解调器、无线通信收发机等。通信单元609允许设备600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
[0106]
计算单元601可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元601的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元601执行上文所描述的各个方法和处理,例如方法100。例如,在一些实施例中,方法100可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元608。在一些实施例中,计算机程序的部分或者全部可以
经由rom 602和/或通信单元609而被载入和/或安装到设备600上。当计算机程序加载到ram 603并由计算单元601执行时,可以执行上文描述的方法100的一个或多个步骤。备选地,在其他实施例中,计算单元601可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行方法100。
[0107]
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、现场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、负载可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
[0108]
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
[0109]
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
[0110]
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
[0111]
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)和互联网。
[0112]
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通
过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
[0113]
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开的技术方案所期望的结果,本文在此不进行限制。
[0114]
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
技术特征:
1.一种列车虚拟编组运行控制方法,其特征在于,包括:构建被控对象列车模型;基于所述被控对象列车模型,结合实际运行控制系统的功能搭建仿真学习训练环境;基于ai的列车虚拟编组运行控制算法架构,基于所述虚拟编组的控制目标设计ato算法的奖励函数;基于所述仿真学习训练环境和所述控制算法架构,设计被控对象列车的动作,对ato算法离线训练;将训练后的ato算法集成至列车ato模块,控制列车运行。2.根据权利要求1所述的方法,其特征在于,所述构建被控对象列车模型包括:对被控对象列车构建神经网络动力学模型;基于车载ato的历史数据库对神经网络动力学模型进行离线训练学习。3.根据权利要求1或2所述的方法,其特征在于,还包括:所述基于所述被控对象列车模型,结合列车运行控制系统的功能搭建仿真学习训练环境包括:基于被控对象列车模型,结合列车运行控制系统相关功能需求,搭建列车运行控制仿真平行系统/数字孪生系统,以便当ato算法输出的列车动作指令时,被控对象列车根据动作指令执行对应动作。4.根据权利要求1所述的方法,其特征在于,控制算法包括:q-learning、dqn、dpg、ddpg中的一个。5.根据权利要求1所述的方法,其特征在于,所述基于所述虚拟编组的控制目标设计ato算法的奖励函数包括:通过量化速度跟随各效果指标的情况设计ato算法的奖励函数。6.根据权利要求5所述的方法,其特征在于,所述通过量化速度跟随各效果指标的情况设计ato算法的奖励函数包括:根据需求分别判断各效果指标的重要程度;根据各效果指标的重要程度设置各效果指标的权重;通过量化速度跟随各效果指标的情况,并结合各效果指标的权重设计ato算法的奖励函数。7.根据权利要求1所述的方法,其特征在于,所述控制列车运行包括:根据列车感知系统采集的列车状态信息和车车通信获取领航列车的状态信息作为ato算法的输入,输出列车的期望控制量;根据列车的期望控制量施加相应的牵引力和/或制动力,控制列车运行;重复上述步骤直至驾驶任务结束。8.一种列车虚拟编组运行控制装置,其特征在于,包括:建模单元,用于构建被控对象列车模型;学习单元,用于基于所述被控对象列车模型,结合实际运行控制系统的功能搭建仿真学习训练环境;算法调整单元,用于基于ai的列车虚拟编组运行控制算法架构,基于所述虚拟编组的控制目标设计ato算法的奖励函数;训练单元,用于基于所述仿真学习训练环境和所述控制算法架构,设计被控对象列车
的动作,对ato算法离线训练;控制单元,用于将训练后的ato算法集成至列车ato模块,控制列车运行。9.一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的方法。10.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-7中任一项所述的方法。
技术总结
本公开涉及列车控制技术领域,尤其提供一种列车虚拟编组运行控制方法及装置。所述方法包括:构建被控对象列车模型;基于所述被控对象列车模型,结合实际运行控制系统的功能搭建仿真学习训练环境;基于AI的列车虚拟编组运行控制算法架构,基于所述虚拟编组的控制目标设计ATO算法的奖励函数;基于所述仿真学习训练环境和所述控制算法架构,设计被控对象列车的动作,对ATO算法离线训练,将训练后的ATO算法集成至列车ATO模块,控制列车运行。以此方式,可以采用训练后的ATO算法对列车进行智能自动驾驶控车运行,实现列车高效、安全、稳定、鲁棒的运行控制。的运行控制。的运行控制。
技术研发人员:陈明亮 张蕾 肖骁
受保护的技术使用者:交控科技股份有限公司
技术研发日:2022.12.27
技术公布日:2023/5/4
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/