一种避免车辆二次碰撞的自主决策控制系统与方法

未命名 07-11 阅读:150 评论:0


1.本发明涉及视觉定位技术领域,特别是涉及一种避免车辆二次碰撞的自主决策控制系统与方法。


背景技术:

2.道路交通事故给国民经济发展和人民生命财产安全造成严重威胁,而这其中90%以上的交通事故是因驾驶员操作失误造成的。当前车辆主动安全功能往往只考虑了通过一系列操作避免碰撞,而没有考虑发生碰撞后的稳定性控制。车辆受到碰撞冲击后,往往伴随着横摆角速度以及侧向速度的突然增大,驾驶员反应不及时或操作不当等将导致车辆失稳并偏离原有轨道,引发二次碰撞甚至多次碰撞事故,其严重伤害风险远远高于单次撞击事故,将造成严重的伤亡损失。
3.为了稳定车辆发生碰撞后的运动状态,德国大众公司研制开发了多次碰撞预防系统,当安全气囊控制单元识别到车辆第一次撞击后,该功能将被激活并自动执行紧急制动,使车辆速度尽快降低到10km/h,从而在一定程度上避免或缓解二次碰撞。然而,考虑到车辆受到碰撞后剧烈变化的横摆角速度以及侧向速度,单纯的制动策略并不能有效降低二次碰撞的风险,因为制动操作并没有直接对车辆进行稳定性控制,横摆角速度以及侧向速度的衰减只是车速降低附带产生的效果。此外,仅依靠车辆的电子稳定控制系统(electronic stability controller,esc),同样难以满足车辆在碰撞后避免二次碰撞的工程需求,这是由于esc只能保证车辆在一定扰动范围内的横向运动稳定性,并不能有效地降低车辆与目标路径的横向位移偏差与航向角偏差,因此仍可能与相邻车道的车辆产生二次碰撞,尤其是当车身偏转90
°
与其他车辆发生侧向碰撞时,将会导致更严重的事故。
4.现有研究采用的动力学模策略型往往过于理想,无法反映车辆在极限驾驶工况下附着的复杂特性。实际上,对于不同性质、不同程度的碰撞以及发生碰撞后的不同阶段,车辆的主要优化目标是随之变化的。而当前研究的评价指标过于简化和分散,缺乏针对极限驾驶工况下车辆安全性能指标的机理分析和体系整合,难以实现整体控制过程的综合优化。


技术实现要素:

5.本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
6.为此,本发明提出一种避免车辆二次碰撞的自主决策控制系统。以实现在最大限度减轻初次碰撞损失的同时,能够在碰撞发生后保证车身稳定性并将车辆迅速恢复到碰撞前初始状态,从而降低车辆在碰撞之后发生二次碰撞及连环碰撞的风险,提升车辆的安全性能。
7.本发明的另一个目的在于提出一种避免车辆二次碰撞的自主决策控制方法。
8.为达上述目的,本发明一方面提出一种避免车辆二次碰撞的自主决策控制系统,包括:控制对象、碰前转向控制模块和碰后控制模块,其中,
9.所述碰前转向控制模块,包括前馈转向控制器,在碰撞发生前并满足预设的触发条件时,所述前馈转向控制器将第一控制命令发送给所述控制对象;
10.所述碰后控制模块,包括基于规则切换的碰后控制模块和基于强化学习算法的碰后控制模块;在发生碰撞后,所述基于规则切换的碰后控制模块根据当前车辆运动状态及优化控制目标建立基于规则切换的碰后控制策略,并对所述基于强化学习算法的碰后控制模块中的网络参数进行优化得到最优控制策略,以将第二控制命令发送给所述控制对象;
11.所述控制对象,用于在响应所述第一控制命令和所述第二控制命令的前提下,执行车辆碰撞后控制参数的优化操作。
12.为达上述目的,本发明另一方面提出一种避免车辆二次碰撞的自主决策控制方法,包括:
13.在碰撞发生前并满足预设的触发条件时,得到第一控制命令;
14.在发生碰撞后,根据当前车辆运动状态及优化控制目标建立基于规则切换的碰后控制策略,并对网络参数进行优化得到最优控制策略以产生第二控制命令;
15.执行所述第一控制命令和所述第二控制命令,以优化车辆碰撞后控制参数。
16.本发明实施例的避免车辆二次碰撞的自主决策控制系统和方法,以实现在最大限度减轻初次碰撞损失的同时,能够在碰撞发生后保证车身稳定性并将车辆迅速恢复到碰撞前初始状态,从而降低车辆在碰撞之后发生二次碰撞及连环碰撞的风险,提升车辆的安全性能。
17.本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
18.本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
19.图1是根据本发明实施例的避免车辆二次碰撞的自主决策控制系统结构示意图;
20.图2是根据本发明实施例的避免车辆二次碰撞的自主决策控制方法的流程图。
具体实施方式
21.需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
22.为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
23.下面参照附图描述根据本发明实施例提出的避免车辆二次碰撞的自主决策控制系统和方法。
24.图1是本发明实施例的避免车辆二次碰撞的自主决策控制系统的结构示意图。
25.如图1所示,包括碰前转向控制模块100、碰后控制模块200、基于规则切换的碰后
控制模块210、基于强化学习算法的碰后控制模块220、控制对象300、前馈转向控制器110、碰撞模拟软件120、漂移模式211、车身稳定模式212、路径跟踪模式213、无控制模式214、切换逻辑215、策略网络221、评价网络222、经验池223。
26.在一个实施例中,碰前转向控制模块100在碰撞发生前且满足触发条件时,其前馈转向控制器110将控制命令发送给控制对象300。发生碰撞后,碰后控制模块200开始起作用,基于强化学习算法的碰后控制模块220在算法训练初期通过跟踪基于规则切换的碰后控制模块210得到的控制策略对其网络参数进行初始化,从而避免强化学习算法在策略探索初期的随机无序性。在此基础上基于强化学习算法的碰后控制模块220进一步探索得到最优控制方案,其中评价网络222通过学习价值函数来提高采样效率,策略网络221学习策略函数并将控制命令发送给控制对象300。同时控制对象300将状态转移元素存于经验池223中,用于后续随机采样和网络更新。
27.进一步地,基于规则切换的碰后控制模块210中的各控制模式211-214可应用不同的控制算法,可根据实际情况进行选择。
28.进一步地,基于强化学习算法的碰后控制模块220可根据实际情况选择不同类型的强化学习算法进行选择并进行改进。
29.进一步地,碰前转向控制模块100,通过在碰撞发生前提前采取反向的前馈转向控制,对抗和抵消碰撞导致的车身滑移和旋转,从根源上有效地抑制碰撞导致的车辆横摆角速度以及航向角的剧烈增长,同时能够降低碰撞后的控制难度。
30.基于规则切换的碰后控制模块210,根据当前车辆运动状态及主要优化控制目标,建立了基于规则切换的碰后控制策略。利用该模块得到的策略将作为先验知识对基于强化学习算法的碰后控制模块220的网络参数进行初始化,使得强化学习算法在策略探索初期能够快速收敛到更合理的方向。
31.基于强化学习算法的碰后控制模块220,在基于规则切换的碰后控制模块210的基础上进一步探索得到最优控制策略。通过对发生碰撞后车辆运动状态的深入机理分析以及各优化指标的系统性整合,实现车辆碰撞后整个控制过程的综合优化。
32.可以理解的是,控制对象300,用于在响应前馈转向控制器110发出的第一控制命令和策略网络221学习策略函数发出的第二控制命令的前提下,执行车辆碰撞后控制参数的优化操作。
33.作为一种可能的实现方式,碰前转向控制模块100通过车辆感知系统得到本车和他车的相对位置信息以及相对速度信息,在预测到碰撞即将发生前的有限时间内,通过提前采取前馈转向控制产生一个相反方向的横摆力矩来对抗和抵消碰撞导致的车身滑移和旋转。为了得到当前碰撞、条件下对应的最佳前馈转向角,基于碰撞模拟分析软件对不同的碰撞工况以及各工况下不同的前馈转向操作进行了事故模拟并采集相关数据建立了碰撞数据库。假设车辆在碰撞之前提前t秒进行前馈转向操作,则基于该碰撞数据库可查表得到当前碰撞条件下对应的最佳前馈转向角,使得前车的横摆角速度以及航向角在碰撞结束后初始时刻的绝对值最小,即
[0034][0035]
其中,j为前馈控制的损失函数,δf为前馈转向控制的车辆前轮转角。r0和φ0分别
为车辆在碰撞结束后初始时刻的横摆角速度和航向角。
[0036]
作为一种可能的实现方式,基于规则切换的碰后控制模块210根据碰撞的不同性质、不同程度以及碰撞后不同阶段分为四种控制模式,分成但不限于以下模式:(1)漂移模式,(2)车身稳定模式,(3)路径跟踪模式,(4)无控制模式。控制输出为车辆期望的前轮转角、左后轮纵向滑移率以及右后轮纵向滑移率。同时本发明还设计了各控制模式间的切换判据。下面将具体介绍各控制模式的控制策略及切换逻辑。
[0037]
(1)漂移模式:在碰撞后的初期,利用漂移这种激进的驾驶技巧,最大限度地扩展车辆底盘系统的动力学控制边界,从而有效抑制发生碰撞之后导致的质心侧偏角、航向角及侧向位移的迅速增长。在漂移控制模式下,车辆全力转向,前轮转角方向与碰撞后的初始横摆角速度方向相反。两个后轴车轮处于附着饱和状态,在摩擦圆限制下分别提供相反方向上的最大纵向力,使得车辆在横纵向力共同作用产生的横摆力矩下最大程度地调节车身横摆及偏航运动。
[0038]
(2)车身稳定模式:当稳定车身运动状态成为车辆当前主要优化目标时,车身稳定控制模式被激活。其作用原理与esc类似,通过在左后轮与右后轮施加相反方向的纵向力来产生横摆力矩,从而稳定车身横摆角速度。
[0039]
(3)路径跟踪模式当减小车辆与目标路径的横向位移偏差与航向角偏差成为当前主要优化目标时,路径跟踪控制模式被激活。针对该模式设计了车辆路径跟踪控制策略,在保证车辆的横向稳定性的同时使得横向位移偏差与航向角偏差趋于0。
[0040]
(4)无控制模式当车辆横向位移偏差、航向角偏差以及车身姿态稳定在一定范围内时,车辆能够按照碰撞前的运动方向继续在原车道行驶,达到最终控制目标。此时无控制模式激活,不再施加任何控制操作。
[0041]
(5)各模式切换逻辑:控制器根据车辆当前的横向位移偏差、航向角偏差、横摆角速度以及质心侧偏角确定当前的控制模式并施加控制。各控制模式的切换逻辑如图1所示。
[0042]
作为一种可能的实现方式,基于强化学习算法的碰后控制模块220在基于规则切换的碰后控制模块210的基础上结合强化学习算法进一步探索得到碰后控制的最优控制方案,并在车辆仿真平台上进行训练。以奖励函数的形式对多重优化指标进行系统性整合及建模,解决了基于规则切换的碰后控制模块210中优化目标单一、难以实现综合优化的问题。下面将介绍该模块中强化学习算法的具体设计。
[0043]
(1)状态空间:状态空间sr中包含车辆发生碰撞后的运动状态信息以及基于规则切换的碰后控制模块的控制策略参考信息,如下式所示:
[0044]
sr=[xe,xb]
t
[0045][0046][0047]
式中,xe和xb分别为车辆状态信息和基于规则切换的控制策略信息。v
x
,vy和分别为车辆坐标系下自车的纵向速度、横向速度和横摆角速度,(x,y)和ψ分别为大地坐标系下自车的质心位置和横摆角,a
x
和ay分别为车辆的纵向加速度和横向加速度。m为当前状态对应基于规则的控制器的控制模式,包括:1)漂移模式,2)车身稳定模式,3)路径跟踪模式,4)
无控制模式等四种模式。δ
rule
,和分别为基于规则的控制器输出的前轮转角、左后轮纵向滑移率和右后轮纵向滑移率的期望值。
[0048]
(2)动作空间:动作空间包含以下三个元素:
[0049][0050]
其中,δd为期望的自车前轮转向角,和分别为期望的自车左后轮和右后轮的纵向滑移率。
[0051]
(3)奖励函数:
[0052]

即时奖励:(a)路径跟踪项:路径跟踪项r
ri1
用于鼓励车辆在碰撞发生后的控制过程中减小与目标路径的横向位移偏差与航向角偏差,使车辆尽快恢复到碰撞前的运动方向并继续在原车道内行驶,从而降低与其他车道的车辆发生二次碰撞的可能性。r
ri1
定义为:
[0053]rri1
=k
r1
·
|ey|+k
r2
·
|e
φ
|
[0054]
其中,ey为车辆的实际和参考侧向位移的偏差,e
φ
为车辆的实际和参考航向角的偏差,k
r1
和k
r2
为负常数,分别用于调整侧向位移偏差和航向角偏差的奖励权重。
[0055]
(b)车身稳定项:车身稳定项r
ri2
用于鼓励车辆在控制过程中保持稳定的运动状态,防止由于碰撞的较大冲击或碰撞后的过度调整产生过大的横摆角速度和质心侧偏角,导致车身稳定性的恶化。因此r
ri2
定义为
[0056][0057]
其中,k
r3
为负常数,用于调整横摆角速度和质心侧偏角β绝对值大小的奖励权重。
[0058]
(c)侧翻风险项:本发明中不涉及车辆发生侧翻的情形,但控制过程中仍然考虑了降低车辆侧翻的风险。将横向载荷转移率(lateral load rransfer ratio,ltr)作为车辆侧翻风险指数,其定义为:
[0059][0060]
其中,f
zi
(i=1,2,3,4)分别为车辆左前轮、右前轮、左右轮、右后轮的垂直载荷。由式(5-24)可知,当ltr=0时,没有发生横向载荷转移;当ltr=1时,车轮刚好离地;当ltr》1时,车辆发生侧翻。将ltr的安全阈值设置为ltr
t
=0.8,r
ri3
定义为:
[0061][0062]
式中,ltr
t
为横向载荷转移率的安全阈值,k
r4
为负常数,用于调整侧翻风险项的奖励权重。在车辆行驶过程中,当ltr小于等于其安全阈值时,r
ri3
设置为0;当ltr大于其安全阈值时,则根据偏离安全阈值的程度给予相应的惩罚。
[0063]
(d)输入大小及变化率项:智能体的实际控制输入[δ,s
x3
,s
x4
]
t
及其变化率的大小与奖励之间的关系呈负相关。输入项及其变化率越小,车辆越容易保持在一个线性稳定的区域,不易失稳。r
ri4
定义为
[0064][0065]
其中,k
r5
、k
r6
为负常数,分别用于调整输入项及其变化率大小的奖励权重。
[0066]
最终即时奖励r
ri
为上述各项r
ri1
~r
ri4
的总和。
[0067]

终止状态奖励r
rt
:当车辆碰撞控制处于终止状态时,该训练回合结束,将基于自车不同的状态模式给予终止状态奖励。该终止状态共有三种结局模式,分别为发生侧翻、完成控制目标以及一定时间内仍未完成控制目标。
[0068][0069]
其中,k
r7
为负常数,当车辆在碰撞后的控制过程中发生侧翻,则给予较大的惩罚。
[0070]
完成控制目标是指发生碰撞后车身达到稳定状态并将侧向位移及航向角恢复到碰撞前初始状态,其判断条件与基于规则切换的控制器中的无控制模式一致,则完成控制目标。此时给予智能体的奖励为r
rtc
,其奖励大小反映了车辆发生碰撞后的总体控制效果,其取决于多种因素的组合,包括控制过程中的车身最大侧向位移距离|y|
max
、控制时长tc以及控制期间车辆驶过的纵向位移距离|x|
max
。r
rtc
定义为:
[0071]rrtc
=k
r8
·
|y|
max
+k
r9
·
tc+k
r10
·
|x|
max
[0072]
其中,k
r8
,k
r9
和k
r10
为负常数,分别用于调整|y|
max
,t
end
和|x|
max
的奖励权重。当控制过程中的车身最大侧向位移距离|y|
max
越小,控制时长tc越短,以及控制期间车辆驶过的纵向位移距离|x|
max
越小,则奖励值越大。
[0073]
若车辆经过一定时间t
end
的控制作用后仍未完成控制目标,则停止本回合训练,其终止状态奖励r
rtn
定义为:
[0074]rrtn
=k
r11
+k
r8
·
|y|
end
+k
r12
·
φ|
end
[0075]
式中,r
rtn
奖励函数由基础惩罚部分k
r11
和终止状态部分(k
r8
·
|y|
end
+k
r12
·
|φ|
end
)组成,其中k
r11
和k
r12
为负常数,分别用于调整基础惩罚和最终航向角大小|φ|
end
的奖励权重,k
r8
用于调整最终侧向位移距离|y|
end
的奖励权重。
[0076]
综合上述所有的因素,最终得到智能体奖励函数rr表示为即时奖励r
ri
与终止状态奖励r
rt
的总和,即
[0077]rr
=r
ri
+r
rt
[0078]
由此,基于现实生活场景中车辆受到碰撞冲击后容易引发二次碰撞甚至多次碰撞事故,其严重伤害风险远远高于单次撞击事故,将造成严重的伤亡损失。当前车辆主动安全系统及相关研究缺乏往往只考虑了通过一系列操作避免碰撞,而没有考虑发生碰撞后的稳定性控制。此外,现有研究采用的碰撞预测模型往往进行了大量的额外假设及简化处理,且评价指标过于简化和分散,难以实现整个控制过程的综合优化的劣势。对此,本发明提供一种避免车辆二次碰撞的自主决策控制系统,以实现在最大限度减轻初次碰撞损失的同时,能够在碰撞发生后保证车身稳定性并将车辆迅速恢复到碰撞前初始状态,从而降低车辆在碰撞之后发生二次碰撞及连环碰撞的风险,提升车辆的安全性能。
[0079]
进一步地,自动驾驶技术的发展对车辆的主动安全功能提出了新的需求,也为进
一步提升极限工况下的车辆主动安全性能提供了平台和技术支撑。在本发明提供的避免车辆二次碰撞的自主决策控制系统在未来多年内的使用将会越来越多,本发明的应用前景广阔。
[0080]
本发明的避免车辆二次碰撞的自主决策控制系统,能够在碰撞发生后保证车身稳定性并将车辆迅速恢复到碰撞前初始状态,从而降低车辆在碰撞之后发生二次碰撞及连环碰撞的风险,提升车辆的安全性能。
[0081]
为了实现上述实施例,如图2所示,本实施例中还提供了避免车辆二次碰撞的自主决策控制方法,该方法包括:
[0082]
s1,在碰撞发生前并满足预设的触发条件时,得到第一控制命令;
[0083]
s1,在发生碰撞后,根据当前车辆运动状态及优化控制目标建立基于规则切换的碰后控制策略,并对网络参数进行优化得到最优控制策略以产生第二控制命令;
[0084]
s1,执行第一控制命令和第二控制命令,以优化车辆碰撞后控制参数。
[0085]
根据本发明实施例的避免车辆二次碰撞的自主决策控制方法,以实现在最大限度减轻初次碰撞损失的同时,能够在碰撞发生后保证车身稳定性并将车辆迅速恢复到碰撞前初始状态,从而降低车辆在碰撞之后发生二次碰撞及连环碰撞的风险,提升车辆的安全性能。
[0086]
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
[0087]
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。

技术特征:
1.一种避免车辆二次碰撞的自主决策控制系统,其特征在于,包括:控制对象、碰前转向控制模块和碰后控制模块,其中,所述碰前转向控制模块,包括前馈转向控制器,在碰撞发生前并满足预设的触发条件时,所述前馈转向控制器将第一控制命令发送给所述控制对象;所述碰后控制模块,包括基于规则切换的碰后控制模块和基于强化学习算法的碰后控制模块;在发生碰撞后,所述基于规则切换的碰后控制模块根据当前车辆运动状态及优化控制目标建立基于规则切换的碰后控制策略,并对所述基于强化学习算法的碰后控制模块中的网络参数进行优化得到最优控制策略,以将第二控制命令发送给所述控制对象;所述控制对象,用于在响应所述第一控制命令和所述第二控制命令的前提下,执行车辆碰撞后控制参数的优化操作。2.根据权利要求1所述的系统,其特征在于,所述基于强化学习算法的碰后控制模块,包括策略网络、评价网络和经验池;所述评价网络,用于利用价值函数得到采样效率阈值,所述策略网络用于采用策略函数并将所述第二控制命令发送给所述控制对象,所述控制对象用于将产生的状态转移元素存于所述经验池中。3.根据权利要求1所述的系统,其特征在于,所述碰前转向控制模块,还包括碰撞模拟分析模块,所述碰前转向控制模块,用于根据基于车辆感知系统得到的车辆位置和速度信息以产生所述第一控制命令,所述一控制命令包括前馈转向控制指令;以及所述碰撞模拟分析模块,用于根据对不同碰撞工况数据的分析结果构建碰撞数据库,以利用所述碰撞数据库得到最佳前馈转向角。4.根据权利要求1所述的系统,其特征在于,所述基于规则切换的碰后控制模块,包括控制模式模块和各模式逻辑切换模块;其中,所述控制模式模块,包括基于规则的控制器的控制模式;所述各模式逻辑切换模块,用于所述控制器根据车辆当前的横向位移偏差、航向角偏差、横摆角速度以及质心侧偏角确定当前的控制模式并输出车辆控制参数;所述控制模式包括漂移模式、车身稳定模式、路径跟踪模式和无控制模式。5.根据权利要求4所述的系统,其特征在于,所述基于强化学习算法的碰后控制模块,还用于基于奖励函数对多重优化指标进行系统性整合及建模,包括:状态空间s
r
中包含车辆发生碰撞后的运动状态信息以及基于规则切换的碰后控制模块的控制策略参考信息,表达式为:s
r
=[x
e
,x
b
]
tt
式中,x
e
和x
b
分别为车辆状态信息和基于规则切换的控制策略信息,v
x
,v
y
和分别为车辆坐标系下自车的纵向速度、横向速度和横摆角速度,(x,y)和ψ分别为大地坐标系下自车的质心位置和横摆角,a
x
和a
y
分别为车辆的纵向加速度和横向加速度,m为当前状态对应基
于规则的控制器的控制模式,δ
rule
,和分别为基于规则的控制器输出的前轮转角、左后轮纵向滑移率和右后轮纵向滑移率的期望值。6.根据权利要求5所述的系统,其特征在于,所述基于奖励函数对多重优化指标进行系统性整合及建模,还包括:预设动作空间包含的三个元素:其中,δ
d
为期望的自车前轮转向角,和分别为期望的自车左后轮和右后轮的纵向滑移率。7.根据权利要求6所述的系统,其特征在于,所述基于奖励函数对多重优化指标进行系统性整合及建模,还包括获取奖励函数的即时奖励r
ri
:将路径跟踪项r
ri1
定义为:其中,e
y
为车辆的实际和参考侧向位移的偏差,为车辆的实际和参考航向角的偏差,k
r1
和k
r2
为负常数,分别用于调整侧向位移偏差和航向角偏差的奖励权重;将车身稳定项r
ri2
定义为:其中,k
r3
为负常数,用于调整横摆角速度和质心侧偏角β绝对值大小的奖励权重。将侧翻风险项r
ri3
定义为:式中,ltr
t
为横向载荷转移率的安全阈值,k
r4
为负常数,用于调整侧翻风险项的奖励权重;将输入大小及变化率项r
ri4
定义为:其中,k
r5
、k
r6
为负常数,分别用于调整输入项及其变化率大小的奖励权重;所述即时奖励r
ri
为上述各项r
ri1
~r
ri4
的总和。8.根据权利要求7所述的系统,其特征在于,还包括获取奖励函数的终止状态奖励r
rt
:其中,k
r7
为负常数。9.根据权利要求8所述的系统,其特征在于,根据所述即时奖励r
ri
与所述终止状态奖励r
rt
得到智能体奖励函数r
r
:r
r
=r
ri
+r
rt
。10.一种避免车辆二次碰撞的自主决策控制方法,其特征在于,包括以下步骤,在碰撞发生前并满足预设的触发条件时,得到第一控制命令;
在发生碰撞后,根据当前车辆运动状态及优化控制目标建立基于规则切换的碰后控制策略,并对网络参数进行优化得到最优控制策略以产生第二控制命令;执行所述第一控制命令和所述第二控制命令,以优化车辆碰撞后控制参数。

技术总结
本发明公开了一种避免车辆二次碰撞的自主决策控制系统与方法,该方法包括:在碰撞发生前并满足预设的触发条件时,得到第一控制命令;在发生碰撞后,根据当前车辆运动状态及优化控制目标建立基于规则切换的碰后控制策略,并对网络参数进行优化得到最优控制策略以产生第二控制命令;执行第一控制命令和第二控制命令,以优化车辆碰撞后控制参数。本发明结合碰前控制和碰后控制,在减轻初次追尾碰撞损失的同时降低车辆碰撞后的控制难度;结合漂移操作与车身稳定性控制,从而充分利用车辆的机动性能,在碰撞后迅速恢复车辆稳定性,以奖励函数的形式对追尾碰撞后的各优化指标进行系统整合及建模,解决了车辆发生碰撞后的复杂多目标优化控制问题。标优化控制问题。标优化控制问题。


技术研发人员:侯晓慧 张俊智 何承坤 赵世越
受保护的技术使用者:清华大学
技术研发日:2023.01.10
技术公布日:2023/7/4
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐