用于测试车辆的驾驶员辅助系统的方法和系统与流程

未命名 07-11 阅读:64 评论:0


1.本发明涉及用于测试车辆的驾驶员辅助系统的一种计算机实现的方法和一种系统,其中,模拟车辆所处的场景并且驾驶员辅助系统基于模拟的场景在车辆的周围环境中运行,并且其中,观察驾驶员辅助系统在车辆的周围环境中的驾驶行为。


背景技术:

2.在进一步的研发中能实现自主驾驶(英文为autonomous driving,即自主驾驶,简写为ad)的驾驶员辅助系统(英文为advanced driver assistance systems,即高级驾驶员辅助系统,简写为adas),在私人轿车领域和商用车领域中越来越为流行。驾驶员辅助系统为提升主动交通安全性作出了重要贡献并且用于提高驾驶舒适性。
3.除了特别是诸如abs(防抱死系统)和esp(电子稳定程序)之类的用于行驶安全的系统外,在私人轿车和商用车领域中还提供了许多驾驶员辅助系统。
4.已经被用于提高主动的交通安全性的驾驶员辅助系统有停车辅助、也称为自适应巡航控制(acc)的自适应车距调节速度控制器,acc与和前车的间距相适应地调节由驾驶员选择的期望速度。针对这些驾驶员辅助系统的另一些例子有:acc启停系统,其除了acc外也促成了堵车时或者车辆停止时车辆的自动的继续行驶;车道保持或车道辅助系统,其将车辆自动保持在车道上;和预碰撞系统,其在可能发生碰撞的情况下例如准备好或者导入制动,以便将动能从车辆导出,以及在必要时采取进一步的措施,倘若碰撞无可避免的话。
5.这些驾驶员辅助系统通过在紧急状况下向驾驶员发出警告,到例如通过激活紧急制动功能引入自动干预以避免事故或减轻事故后果,来提高交通安全性。还额外通过诸如自动停车、自动车道保持和自动间距控制之类的功能提高驾驶舒适性。
6.只有当驾驶员辅助系统以安全、可靠和尽可能舒适的方式进行支持时,车辆乘员才会积极地感受到驾驶员辅助系统在安全性和舒适性方面的好处。
7.此外,每个驾驶员辅助系统必须视功能而定本着确保本车的最大安全并且也不危及其它车辆或其它交通参与者的原则来处理交通中出现的场景。
8.车辆的相应的自动化等级在此划分成所谓的自动化等级1至5(参看例如标准sae j016)。本发明尤其涉及一种自动化等级3至5的带有驾驶员辅助系统的车辆,自动化等级3至5通常视为自主驾驶。
9.测试这种系统的挑战是多样化的。尤其是必须在测试耗费和测试覆盖率之间找到平衡。在此,在测试asas/ad功能时的主任务是,要证明在所有能设想到的状况下、特别是也在关键的行驶状况下,驾驶员辅助系统的功能均得到保证。这些关键的行驶状况具有一定程度的危险性,因为相应的驾驶员辅助系统没有反应或作出错误反应会导致事故。
10.因此对驾驶员辅助系统的测试需要考虑大量可能在不同的场景下出现的行驶状况。可能的场景的变化空间在此通常通过多个维度撑开(例如不同的道路特性、其它交通参与者的行为、天气条件等)。对测试驾驶员辅助系统而言特别重要的是,从这个几乎无限的和多维的参数空间中提取用于可能导致不寻常的或危险的行驶状况的关键场景的这些参
数集群(parameterkonstellation)。
11.如图1所示,这些关键的场景具有远比一般的场景小得多的出现概率。
12.一些科学出版物的认为,车辆在自主驾驶运行中的运行只有在用相应的驾驶员辅助系统完成2.75亿英里无事故驾驶时间来验证相应的驾驶员辅助系统时,才在统计学上比人控制的车辆更为安全。这原本无法借助真正的测试驾驶实现,特别是在汽车行业中所要求的研发周期和质量标准已经设置了一个极为紧凑的时间框架的背景下。出于前述原因,也不大可能包含足够量的关键的场景或由这些场景产生的行驶状况。
13.由现有技术已知,使用真正的测试车辆车队的真实的测试行驶数据来验证和证实驾驶员辅助系统,并且从所记录的数据中提取场景。此外还已知的是,使用全因素实验设计来进行验证和证实。


技术实现要素:

14.本发明的任务是,在关键的场景中可以检查驾驶员辅助系统、特别是用于自主驾驶的驾驶员辅助系统。本发明的任务尤其在于,辨别针对驾驶员辅助系统的关键场景。该任务通过独立权利要求的教导解决。有利的设计方案在从属权利要求中找到。
15.本发明的第一个方面涉及一种用于测试车辆的驾驶员辅助系统的计算机实现的方法,其具有下列工作步骤:
16.模拟车辆所处的场景;
17.基于所模拟的场景在车辆的周围环境中运行驾驶员辅助系统;
18.观察驾驶员辅助系统在车辆的周围环境中的驾驶行为;
19.确定通过驾驶员辅助系统在车辆的周围环境中的驾驶行为所产生的行驶状况;
20.根据所产生的行驶状况的危险性求出所模拟的场景的质量;
21.检查至少一个终止条件;并且
22.基于所求出的质量改变所模拟的场景,直至满足涉及到质量的至少一个终止条件。
23.本发明的第二个方面涉及一种用于测试车辆的驾驶员辅助系统的系统,该系统具有:
24.用于模拟车辆所处的场景的器件;
25.用于基于所模拟的场景在车辆的周围环境中运行驾驶员辅助系统的器件;
26.用于观察驾驶员辅助系统在车辆的周围环境中的驾驶行为的器件;
27.用于确定通过驾驶员辅助系统在车辆的周围环境中的驾驶行为所产生的行驶状况的器件;
28.用于根据所产生的行驶状况的危险性求出所模拟的场景的质量的器件;
29.用于检查至少一个终止条件的器件;和
30.用于基于所求出的质量改变所模拟的场景,直至满足涉及到质量的至少一个终止条件的器件。
31.本发明的第三个方面涉及一种用于测试车辆的驾驶员辅助系统的系统,该系统具有agent(智能体),其中,agent设置用于,产生场景并且通过改变场景来引发驾驶员辅助系统的故障,并且其中,借助强化学习的方法,通过agent与驾驶员辅助系统在运行期间的交
互来持续改进一种用于改变场景的策略,直至达到终止条件。
32.车辆的周围环境按照本发明优选至少由与借助驾驶员辅助系统驾驶车辆相关的对象形成。车辆的周围环境尤其包括场景和动态的元素。场景优选包括所有静态的元素。
33.场景按照本发明优选由场景的、特别是静态的场景的时间序列形成。场景在此例如说明了至少一个其它的对象相对自我对象(ego-objekt)的空间布置,例如交通参与者集群。场景可以尤其包含驾驶员辅助系统至少部分控制被称为本车的装备有驾驶员辅助系统的车辆、例如自主实施本车的至少一个车辆功能的行驶状况。
34.行驶状况按照本发明优选描述为了在特定的时间点上选择驾驶员辅助系统的适用的行为模式而必须考虑到的情形。由于行驶状况代表本车的视野,行驶状况因此优选是主观的。行驶状况进一步优选包括行动的相关条件、可能性和影响因子。行驶状况进一步优选基于瞬时的、例如特定于任务的以及永久的目标和值通过信息选择的过程从场景中推导出。
35.驾驶行为按照本发明优选是驾驶员辅助系统通过动作和反应在车辆的周围环境中的行为。
36.质量按照本发明优选表征模拟的场景。质量优选指的是模拟的场景就其用于测试驾驶员辅助系统的适用性而言的品质或性质。关键的场景在此优选具有更高的质量。来自针对被测试的驾驶员辅助系统的相应的场景的行驶状况的危险性,优选是场景的质量的衡量尺度。
37.增强学习是一种机器学习的方法,在该方法中,agent学习周围环境中的独立的活动。这由此发生,即,agent在周围环境中试验不同的动作并且通过周围环境的反馈要么获得奖励要么获得惩罚。在学习阶段之后,agent有能力在周围环境中实施活动,因而agent为此获得了尽可能大的奖励。
38.agent按照本发明优选指的是一种计算机程序或数据处理设备的一个模块,其能进行一定程度上独立的和有自我活力的、特别是自主的行为。这意味着,根据不同的状态、特别是不同的状况进行预先确定的处理过程,而不需要从外部给出进一步的开始信号或者在行驶期间进行外部的控制干预。
39.本发明基于的想法时,这样来迭代地改进模拟的场景,使得它们尽可能良好地适用于测试驾驶员辅助系统。换句话说,这样来改进模拟的场景,使得它们尽可能良好地适用于显示或引发驾驶员辅助系统中的可能的故障。由此可以专门就特定的驾驶员辅助系统或驾驶员辅助系统的功能优化模拟的场景。
40.优选可以规定,存在终止条件,在达到终止条件时,终止迭代过程。若没有达到这种终止条件,那么可以例如设置最大的测试时间或者也设置机动车在模拟的场景中完成的所经过的最大的测试公里数作为另外的终止条件。模拟的场景的质量,即评估模拟的场景的参数,优选取决于涉及到分别在各个迭代步骤中产生的行驶状况的所定义的标准。
41.作为标准,行驶状况的危险性在此尤其被用作质量的衡量尺度。质量的这种衡量尺度进一步优选是直至碰撞时间点的计算出的持续时间、事故概率和/或驾驶员辅助系统的不合适的驾驶行为。这种不合适的驾驶行为可以例如具有违反交通规则和/或伴随过度受损、特别是人生受损风险的操作。
42.本发明在此遵循一个游戏两个“玩家”的方案,其中,用于测试驾驶员辅助系统的
方法或系统,均试图迭代地产生复杂度加大的场景,直至违反预定义的标准,特别是涉及到驾驶员辅助系统功能性的(安全)关键的指标。在这种情况下,用于测试的方法或系统就“赢”了。若没有引起这种障碍,即达到终止条件,则是被测试的驾驶员辅助系统“赢”了。
43.借助本发明可以大幅减少用于测试驾驶员辅助系统的行程公里数,因为本发明直观地找到了那些对相应的驾驶员辅助系统特别关键的场景。大部分场景可以在正常情况下由相应的驾驶员辅助系统简单地应对解决。不过在这种情况下也无法发现驾驶员辅助系统的薄弱环节。
44.在测试驾驶期间,优选可以构造成软件模块或测试方法中的子算法的所谓的agent,从被测试的驾驶员辅助系统的行为学习并且连续地改进模拟的场景的质量,以便引发所研究的驾驶员辅助系统的故障。
45.测试方法在此被迭代地重复,直至模拟的场景的改变导致驾驶员辅助系统的一种违背了用作终止条件的预定义的目标值的行为。这种终止条件可以例如是直至碰撞时间点的小于0.25秒的持续时间或者也是特定的时间预算,例如600小时的最大模拟时间。
46.假设有足够长的时间预算,那么可以借助本发明达到adas或ad系统正确运行的高概率。借助按本发明的教导执行的测试的效力在此取决于用来改变模拟的场景的算法。这种算法在理想情况下具有类似人类的直觉,通过这种直觉可以将相应的驾驶员辅助系统带到其极限。
47.在用于测试驾驶员辅助系统的方法的一种有利的设计方案中,在模拟场景时预定车辆的速度、特别是初始的速度和/或车辆的轨迹。以这种方式可以在测试时考虑到经验值。agent以这种方式已经被设置到正确的途径上,以便发展出一个关键的场景。
48.在用于测试驾驶员辅助系统的方法的另一种有利的设计方案中,在改变模拟的场景时,改变场景的参数的值。在这种情况下,各现有的场景被迭代地调整并且以这种方式就测试相应的驾驶员辅助系统进行改进。当特定的场景应当为了测试特定的驾驶员辅助系统而进行“优化”时,这种做法就尤为有利。
49.在用于测试驾驶员辅助系统的方法的另一种有利的设计方案中,视有待测试的驾驶员辅助系统而定,从下列组中选出场景的参数:
50.车辆的速度、特别是车辆的初始速度;车辆的轨迹;照明情况;天气情况;车道情况;静态的和/或动态的对象的数量和位置;动态的对象的速度和运动方向;信号设备的、特别是光信号设备的状态;交通标志;车道的垂直高程、宽度和/或可通过性;车道走向;车道数量。
51.在用于测试驾驶员辅助系统的方法的另一种有利的设计方案中,在改变模拟的场景时产生了优选由前后连续地组合的场景构成的新的场景。优选由此表征一个新的场景,即,必须应对解决新的驾驶任务。驶近十字路口的场景例如与在高速公路上行驶的场景根本完全不同。
52.用新的场景取代模拟的场景提供的优点是,用一次测试驾驶就能覆盖许多不同的行驶状况并且可以测试所述驾驶员辅助系统在完全不同的周围环境中的许多功能。这大大提高了测试方法的效力。在创建新的场景时,可以为了改变参数的值尤其也设置全新的参数。
53.在用于测试驾驶员辅助系统的方法的另一种有利的设计方案中,在求出质量时计
入虚构的奖励并且基于设计用于最大化奖励的函数进行改变。在本发明中分别使用的算法、特别是使用这种算法的agent,优选学习,在现有的模拟的场景中的哪些算法或者为了达到期望的效果而对新的场景的哪些改变是目的明显的,这就是说,哪些改变导致了关键的场景并且可能引发驾驶员辅助系统的故障或事故。
54.在用于测试驾驶员辅助系统的方法的另一种有利的设计方案中,各所产生的行驶状况越危险,特别是直至碰撞时间点的所计算的持续时间越短,质量就越高。
55.在另一种有利的设计方案中,在使用进化算法的情况下改变模拟的场景。进化算法也称为遗传算法。在改变这些算法时,将不同的算法进行交叉和突变。由这样生成的算法形成了用于下一个迭代步骤的候选。
56.这样来进行这种选择,即,选出那些有最大概率引起关键场景的候选。遗传进化算法在此提供了高度的灵活性,以便根据预定义的标准优化现有的场景。
57.在用于测试驾驶员辅助系统的方法的另一种有利的设计方案中,基于所求出的质量近似计算一个效用函数,该效用函数说明了特定的场景具有哪些值。算法或agent将模拟的场景的这个值视为一种奖励并且优选这样进行配置,以便因此最大化所述值和奖励。
58.在用于测试驾驶员辅助系统的方法的另一种有利的设计方案中,对驾驶员辅助系统进行模拟。对驾驶员辅助系统的模拟尤为有利,因为在这种情况下,不需要用来测试真正的驾驶员辅助系统的真正的部件的试验台。在这种情况下,尤其可以比实时更快地执行按本发明的方法。模拟的速度在此仅受到所提供的计算性能的限制。
59.在用于测试驾驶员辅助系统的按本发明的方法的另一种有利的设计方案中,连续地改进一种用于借助在测试运行期间基于所求出的质量强化学习的方法来改变场景的策略,直至达到终止条件。在使用强化学习(英文也称为“reinforcement learning”,即强化学习)时,算法或agent自动地学习策略,以便最大化所获得的奖励。为此,可以对所采取的的行动给予正面的和负面的奖励。使用强化学习允许了特别有效地优化模拟的场景。
60.在用于测试驾驶员辅助系统的方法的另一种有利的设计方案中,在最初模拟场景时,考虑到了来自一种驾驶员辅助系统的、特别是所述驾驶员辅助系统的较早的测试运行的历史数据。使用历史数据可以用于预训练算法或agent。由此可以减少直至找到关键的场景的持续时间。此外,也可以使用在其它的、特别是相似的adas或ad系统上训练的算法或agent。尤其能以这种方式实施所谓的回归测试,以便确保,在驾驶员辅助系统的软件的已经测试过的部分中的改变不会引起新的故障。
61.在用于测试驾驶员辅助系统的方法的另一种有利的设计方案中,在运行驾驶员辅助系统时将有关车辆的周围环境的数据馈入到驾驶员辅助系统中和/或基于车辆的周围环境来刺激驾驶员辅助系统、特别是传感器。在这种情况下可以使用按本发明的方法,以便测试实际存在的驾驶员辅助系统。优选在此刺激所述车辆。但原则上也可以想到的是,以此方式在试验台上测试整个车辆连同驾驶员辅助系统。这种设计方案提供的优点是,可以在尽可能真实的条件下测试驾驶员辅助系统及其所有的部件。
62.在用于测试驾驶员辅助系统的系统的一种有利的设计方案中,agent被设置用于,观察通过驾驶员辅助系统基于模拟的场景在车辆的周围环境中的驾驶行为所产生的行驶状况,并且根据所产生的行驶状况的危险性求出场景的质量。
63.在用于测试驾驶员辅助系统的系统的另一种有利的设计方案中,基于历史数据对
agent进行预训练。这些数据在最初模拟场景时被agent考虑到。
64.上述有关本发明的第一个方面的特征和优点相应地也适用于本发明的第二和第三个方面,反之亦然。
附图说明
65.进一步的特征和优点由接下来参考附图的说明得出。附图中:
66.图1至少部分示意性地示出了场景取决于其复杂度的出现概率的图表;
67.图2a至少部分示意性地示出了场景的一个例子;
68.图2b至少部分示意性地示出了具有比图2a的场景的复杂度更高的复杂度的场景的一个例子;
69.图3至少部分示意性地示出了一种用于测试驾驶员辅助系统的方法的实施例;并且
70.图4至少部分示意性地示出了一种用于测试驾驶员辅助系统的系统的实施例。
具体实施方式
71.图1示出了场景的取决于场景的复杂度的出现概率。出现概率是场景在真正的道路交通中发生的概率。
72.在图1中令人注目的是,多个场景具有较低的复杂度,这也对应了汽车驾驶员的普遍的生活经验。这些场景的范围在图1中用“a”标注。在图1中用“b”标注其范围的高复杂度的场景,则较少发生。不过恰好是那些具有高复杂度的场景“b”与对驾驶员辅助系统的高效能的研究高度相关。
73.因此为了在测试驾驶员辅助系统期间达到足够数量和多样化的具有高复杂度的不同的场景,必须根据所示的分布曲线经历熟悉极大数量的场景。
74.图2a示出了第一场景3,在该第一场景中,行人6正在穿越斑马线并且由驾驶员辅助系统2控制的车辆1以及对向车道上的另外的车辆5a接近斑马线。驾驶员辅助系统2在此既控制车辆1的纵向的运动也控制横向的运动。
75.在图2a所示的第一场景3中,无论是行人6,还是道路走向、斑马线和迎面而来的另外的车辆5a,均借助传感器被驾驶员辅助系统2清楚地看到。在所示例子中,驾驶员辅助系统2认识到,它必须降低车速,以便能让斑马线上的行人6通过。其它车辆5a的运动在此可能无关紧要。图2a因此涉及到具有较低复杂度的场景3。
76.在图2b所示的第二场景3中,不存在斑马线。此外,在由驾驶员辅助系统2控制的车辆1的车道旁还停着另外的车辆5b、5c、5d,由于这些另外的车辆,驾驶员辅助系统2的传感器无法或很难被检测到行人6。
77.除了行人6和停放的车辆5b、5c、5d之外,在由驾驶员辅助系统2控制的车辆1附近还有另外的车辆5a,其如图2a所示迎着由驾驶员辅助系统2控制的车辆1而来。
78.摩托车驾驶员4正在这个另外的车辆5a后面行驶。由图2b无从可知这个摩托车驾驶员是否能在由驾驶员辅助系统2控制的车辆1的周围环境中感知到。在所示的场景3中,摩托车驾驶员4试图在另一条车道上超越所述另外的车辆5a。同时行人6在所示场景中试图穿过道路。行人此时对由驾驶员辅助系统2控制的车辆1一无所知。
79.视驾驶员辅助系统2在场景3中如何反应或行动而定,这就是说,视驾驶员辅助系统2在车辆1的周围环境中表现出了哪种驾驶行为而定,产生了一种危险的或不那么危险的行驶状况。如果车辆2例如如在图2b中通过箭头所示那样在所示场景3中以没有降低的速度继续行驶,那么由驾驶员辅助系统2控制的车辆1和摩托车4之间可能出现碰撞。这种行驶状况对应极高的危险性。
80.由于车辆1的驾驶员辅助系统2在图2b所示的场景中必须处理的大量信息以及可以由能被驾驶员辅助系统2在周围环境中看到的交通参与者5a、5b的集群产生的可能的问题,按图2b的第二场景3具有较高的复杂度,特别是对比图2a所示的第一场景。
81.图3示出了用于测试车辆1的驾驶员辅助系统2的方法100的一个实施例。
82.在第一工作步骤101中,模拟车辆1所处的场景3。在此优选一方面模拟带有所有的动态元素、即图2b中的例如行人6、另外的车辆5a和摩托车4以及带有静态的元素、即图2b中的另外的车辆5b、5c、5d和道路的车辆1的周围环境。
83.基于这种模拟,驾驶员辅助系统2可以在必要时和由这个驾驶员辅助系统控制的车辆1一起优选在试验台12中被模拟。驾驶员辅助系统2的传感器在这种情况下优选被这样刺激,以便模仿模拟的场景3或车辆1的通过这种模拟的场景3产生的周围环境。
84.驾驶员辅助系统2或仅驾驶员辅助系统2的软件可以进一步优选以硬件在环测试的方式整合到场景3的模拟中。
85.最后也可以对驾驶员辅助系统2或者也仅对驾驶员辅助系统2的软件进行模拟。
86.进一步优选的是,在模拟场景时,预定车辆1的速度、特别是初始的速度和/或车辆1的轨迹。此外,在模拟场景时,可以优选考虑到来自被测试的驾驶员辅助系统2的或其它驾驶员辅助系统的更早的测试运行的历史数据。这些历史数据尤其在确定初始的模拟的测试场景时有用。此外,还可以优选将这些历史数据用于训练测试驾驶员辅助系统的所谓的agent,或者可以使用已经用于测试特别是其它的驾驶员辅助系统的agent。
87.在第二工作步骤102中,驾驶员辅助系统2基于模拟的场景3在车辆的周围环境中运行。如果也只是模拟驾驶员辅助系统2,那就也模拟驾驶员辅助系统2在由驾驶员辅助系统2控制的车辆1的周围环境中的运行。
88.在第三工作步骤103中,观察驾驶员辅助系统2在由该驾驶员辅助系统2控制的车辆1的周围环境中的驾驶行为。
89.基于通过观察求出的数据,可以在任意时间点上确定一种由驾驶员辅助系统2在车辆1的周围环境中的驾驶行为所产生的行驶状况。这优选在第四工作步骤100中执行。
90.基于所产生的行驶状况,驾驶员辅助系统2必须就它如何表现和控制由这个驾驶员辅助系统控制的车辆1作出新的决定。
91.在模拟的场景3中,可以就危险性客观地研究各所产生的行驶状况。尤其可以基于通过场景3可用的信息在模拟的每个时间步长上计算事故概率、直至碰撞时间点的持续时间。
92.在图2b的场景3中,当由驾驶员辅助系统2控制的车辆1以未降低的速度继续直行时,可以例如计算直至碰撞时间点的持续时间。
93.事故概率可以例如受到对驾驶员辅助系统2的驾驶行为的适当性的评估的影响。当由驾驶员辅助系统2控制的车辆1以强烈偏高的速度行驶时,在图2a或图2b的场景3中的
事故概率例如提高。
94.在第五工作步骤105中,根据涉及到所产生的行驶状况的预定义的标准求出模拟的场景3的质量。所述质量在此尤其由模拟的场景的复杂度得出,其中,模拟的场景3的更高的复杂度表明更高的质量。质量在此优选说明,如何来参考预定义的标准评判通过驾驶员辅助系统2的驾驶行为所产生的行驶状况。这种标准可以例如是所产生的行驶状况的危险性,其通过事故概率和/或直至可能的碰撞时间点的持续时间加以表征。此外,危险性也可以通过驾驶员辅助系统2的不恰当的驾驶行为的概率加以表征。
95.现在在第六工作步骤106中检查,是否满足终止条件。这个终止条件一方面可以由涉及到所产生的行驶状况的预定义的标准定义,例如直至碰撞时间点的最大的持续时间的极限值或者最大的事故概率。也可以额外预定最大的测试时间作为另外的终止条件。
96.若达到终止条件,那么在第八工作步骤108中特别是以测试报告的形式输出模拟的场景或模拟的场景的参数值和/或模拟的场景的质量。
97.如果没有达到终止条件,那么在第七工作步骤107中基于所求出的质量改变模拟的场景。在此,测试方法又从头从第一工作步骤101开始。工作步骤优选被迭代地实施这样长时间,直至达到终止条件中的至少一个终止条件。
98.为了改变模拟的场景,在第七工作步骤107中原则上存在两种不同的途径。一方面,可以仅改变模拟的场景的参数值。在这种情况下,已改变的模拟的场景始终建立在在先前的迭代步骤中所使用的模拟的场景上。当模拟的场景3借助所谓的进化的算法发生改变时,尤其使用这种做法。
99.在改变模拟的场景时,备选产生了一个新的场景。在这种新的场景中,尤其可以更换参数、删除参数和/或添加新的参数。
100.尤其当为用于改变场景的策略使用基于所求出的质量强化学习的方法时,就使用这种做法。在强化学习时,这个策略在测试运行期间被不断改进,直至达到终止条件。在这种情况下,优选基于所求出的质量近似计算一个效用函数,该效用函数说明了特定的模拟的场景具有哪些质量值。
101.如已经提到的那样,改变了场景的算法,优选被构造成所谓的agent。在这种情况下,测试方法像是一种有两个玩家的游戏,其中,agent对抗驾驶员辅助系统2,以便引发驾驶员辅助系统2的故障。
102.所述质量优选通过虚构的奖励表征并且改变基于成本函数或者对成本函数的优化进行。成本函数优选被设计用于最大化虚拟的奖励。各所产生的行驶状况越危险,特别是所计算的直至碰撞时间点的持续时间越短,那么质量优选就越高。
103.此外,用于测试驾驶员辅助系统的方法所包含的工作流程,可以具有下列工作步骤:在另外的第一工作步骤中,将被测试的驾驶员辅助系统和合适的车辆动力学模型、例如一起,集成到合适的建模和集成平台、例如中。在这个集成平台上优选也提供一种3d模拟环境。
104.在另外的第二工作步骤中,创建一个场景模板,该场景模板通常例如借助说明道路特性,例如借助说明交通参与者和车辆操作。备选可以基于来自真实的行驶运行的数据生成虚拟的场景。适用于此的例如有gps数据、传感器数据、对象列表等。
105.在另外的第三工作步骤中,辨别和选择这样一些参数,用于改变场景的算法能用这些参数来改变场景。之后针对这些参数定义一些值域,这些参数可以在所述值域中移动。例如可以预定,算法可以连续地为场景参数“前车的车速”分配在5和35m/s之间的值。在此优选不仅能选择有关由驾驶员辅助系统2控制的车辆1的周围环境的参数,而且也能为了通过算法进行改变而选择车辆1的轨迹。对其它交通参与者而言,轨迹也能作为参数加以改变。对每个交通参与者而言,在此通过路标和时间步长确定个性化的轨迹。所述轨迹然后可以通过改变路标的位置和路标彼此间的间距发生改变。
106.在另外的第四工作步骤中,预定义用来控制场景的迭代产生的特定的标准。若预定义的标准是直至碰撞时间点的持续时间,那么算法就视图最小化这个持续时间并且在场景中检索导致事故的参数值。
107.在另外的第五工作步骤中,定义了合适的终止条件。可能的终止条件例如是,直至碰撞时间点的持续时间为0.25秒或者达到了最大数量的迭代。
108.在另外的第六工作步骤中,生成参数值的初始集。这些参数值是随机产生的,手动选择的,基于真正的测试行驶选择的。以这种方式可以和已经生成的场景模板一起生成可以在3d模拟中实施的具体的场景。
109.由此可以如上文所说明的那样实施用于测试驾驶员辅助系统的方法。
110.图4示出了一种用于测试机动车的驾驶员辅助系统的系统的实施例。
111.这个系统10优选具有:用于模拟车辆1所处场景的器件11;用于在车辆1的周围环境中基于模拟的场景运行驾驶员辅助系统2的器件12;用于观察驾驶员辅助系统2在车辆1的周围环境中的驾驶行为的器件13;用于确定通过驾驶员辅助系统2在车辆的周围环境中的驾驶行为所产生的行驶状况的器件14;用于根据涉及到行驶状况、特别是所产生的行驶状况的危险性的预定义的标准来求出模拟的场景3的质量的器件15;用于检查终止条件的器件16;和用于基于所求出的质量改变模拟的场景3、直至达到终止条件的器件17。
112.前述器件优选由数据处理设备形成。但用于在车辆1的周围环境中运行驾驶员辅助系统的器件12也可以由试验台、特别是用于驾驶员辅助系统或车辆的试验台形成。在这种情况下,用于观察驾驶员辅助系统2的驾驶行为的器件13至少部分由传感器形成。
113.用于改变模拟的场景的器件17可以优选构造成agent。
114.所述系统优选具有接口18,接口优选可以构造成用户接口或构造成数据接口。
115.要指出的是,实施例仅涉及到不应限制保护范围、应用和结构的例子。更确切地说,通过之前的说明为本领域技术人员提供了用于实施至少一个实施例的指南,其中,可以特别是就所说明的组成部分的功能和布置进行多样化的修改,而不会脱离由权利要求和与这些权利要求等效的特征组合产生的保护范围。
116.附图标记列表
117.a、b
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
场景的范围
[0118]1ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
车辆
[0119]2ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
驾驶员辅助系统
[0120]3ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
场景
[0121]4ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
摩托车
[0122]
5a、5b、5c、5d另外的车辆
[0123]6ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
行人
[0124]
11
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
用于模拟的器件
[0125]
12
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
用于运行驾驶员辅助系统的器件
[0126]
13
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
用于观察驾驶行为的器件
[0127]
14
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
用于确定行驶状况的器件
[0128]
15
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
用于求出质量的器件
[0129]
16
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
用于改变场景的器件
[0130]
17
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
用于检查终止条件的器件
[0131]
18
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
接口

技术特征:
1.一种用于测试车辆(1)的驾驶员辅助系统(2)的计算机实现的方法(100),具有下列工作步骤:模拟(101)车辆(1)所处的场景(3);基于所模拟的场景(3)在车辆(1)的周围环境中运行(102)驾驶员辅助系统(2);观察(103)驾驶员辅助系统(2)在车辆(1)的周围环境中的驾驶行为;确定(104)通过驾驶员辅助系统(2)在车辆(1)的周围环境中的驾驶行为所产生的行驶状况;根据涉及到所产生的行驶状况的预定义的标准、特别是所产生的行驶状况的危险性,求出(105)模拟的场景(3)的质量;检查(106)方法(100)的至少一个终止条件;并且基于所求出的质量改变(107)模拟的场景(3),直至满足至少一个终止条件。2.根据权利要求1所述的方法(100),其中,在模拟场景时,预定所述车辆(1)的速度、特别是初始速度和/或所述车辆(1)的轨迹。3.根据权利要求1或2所述的方法(100),其中,在改变所述模拟的场景时,仅改变所述模拟的场景的参数的值。4.根据前述权利要求1至3中任一项所述的方法(100),其中,在改变所述模拟的场景(3)时产生了新的场景,该新的场景优选由前后相继地组合的场景构成。5.根据前述权利要求1至4中任一项所述的方法(100),其中,在求出质量时,所述质量通过虚构的奖励加以表征,并且基于设计用于最大化虚构的奖励的成本函数进行所述改变。6.根据前述权利要求1至5中任一项所述的方法(100),其中,在使用进化算法的情况下改变所述模拟的场景(3)。7.根据前述权利要求1至6中任一项所述的方法(100),其中,基于所求出的质量近似计算效用函数,该效用函数说明了特定的模拟的场景(3)具有哪个质量值。8.根据前述权利要求1至7中任一项所述的方法(100),其中,模拟所述驾驶员辅助系统(2)。9.根据前述权利要求1至8中任一项所述的方法(100),其中,连续地改进一种用于借助在测试运行期间基于所求出的质量强化学习的方法来改变所述场景(3)的策略,直至达到所述终止条件。10.根据前述权利要求1至9中任一项所述的方法(100),其中,在最初模拟所述场景时,考虑来自驾驶员辅助系统的、特别是有待测试的驾驶员辅助系统(2)的较早的测试运行的历史数据。11.根据前述权利要求1至10中任一项所述的方法(100),其中,在运行所述驾驶员辅助系统(2)时,将关于所述车辆(1)的周围环境(4)的数据馈入到所述驾驶员辅助系统(2)中和/或基于所述车辆(1)的周围环境(4)刺激所述驾驶员辅助系统(2)、特别是其传感器。12.一种用于测试机动车(1)的驾驶员辅助系统(2)的系统(10),该系统具有:用于模拟车辆(1)所处的场景(3)的器件(11);用于基于所模拟的场景(3)在车辆(1)的周围环境中运行驾驶员辅助系统(2)的器件(12);
用于观察驾驶员辅助系统(2)在车辆(1)的周围环境中的驾驶行为的器件(13);用于确定通过驾驶员辅助系统(2)在车辆(1)的周围环境中的驾驶行为所产生的行驶状况的器件(14);用于根据涉及到行驶状况的预定义的标准、特别是所产生的行驶状况的危险性来求出模拟的场景(3)的质量的器件(15);用于检查方法(100)的至少一个终止条件的器件(16);和用于基于所求出的质量改变模拟的场景(3)、直至满足至少一个终止条件的器件(17)。13.特别是按照权利要求14所述的一种用于测试机动车(1)的驾驶员辅助系统(2)的系统(10),具有agent(16),其中,agent(16)设置用于,产生场景(3)并且通过改变场景(3)来引发驾驶员辅助系统的故障,并且其中,特别是借助强化学习的方法,通过agent(21)与所述驾驶员辅助系统(2)在运行期间的交互来持续改进一种用于改变场景(3)的策略,直至达到终止条件。14.根据权利要求13所述的系统(10),其中,所述agent(16)设置用于,观察由所述驾驶员辅助系统(2)基于所述模拟的场景(3)在所述车辆(1)的周围环境(4)中的驾驶行为所产生的行驶状况,并且根据所产生的行驶状况的危险性求出所述场景(3)的质量。15.根据权利要求13或14所述的系统(10),其中,基于历史数据对所述agent(16)进行预训练并且在最初模拟所述场景(3)时通过所述agent(16)考虑到了这些数据。

技术总结
本发明涉及一种用于测试车辆的驾驶员辅助系统的计算机实现的方法,其具有下列工作步骤:模拟车辆所处的场景;基于所模拟的场景在车辆的周围环境中运行驾驶员辅助系统;观察驾驶员辅助系统在车辆的周围环境中的驾驶行为;确定通过驾驶员辅助系统在车辆的周围环境中的驾驶行为所产生的行驶状况;根据所产生的行驶状况的危险性求出所模拟的场景的质量;检查至少一个终止条件;并且基于所求出的质量改变所模拟的场景,直至满足涉及到质量的至少一个终止条件。本发明也涉及一种相应的系统。本发明也涉及一种相应的系统。本发明也涉及一种相应的系统。


技术研发人员:米哈伊
受保护的技术使用者:AVL里斯脱有限公司
技术研发日:2021.10.11
技术公布日:2023/6/28
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐