一种端到端自动驾驶方法、系统及电子设备与流程
未命名
07-12
阅读:82
评论:0

1.本发明属于自动驾驶技术领域,特别涉及一种端到端自动驾驶方法、系统及电子设备。
背景技术:
2.端到端自动驾驶依靠人工智能、视觉计算、监控装置等的协同合作,让行车电脑可以在没有人类主动操作时自助操作机动车辆的运行。端到端自动驾驶模型将输入的传感器数据映射为轨迹/控制信号,从而避免传统模块化自动驾驶设计带来的级联误差和复杂的人为制定规则。
3.现有的端到端自动驾驶方法都遵循编码器-解码器原则,其中编码器一般直接将解码器得到的输入传到一个多层感知机中。
4.现有方法的缺点在于:解码器需要负责从编码器得到复杂的全局特征中,找到对于驾驶重要的特征,但解码器往往是简单的多层感知机,因此解码器简单的结构导致其很难完成如此复杂的任务,如果只是简单的增加解码器的宽度和深度,会导致过拟合。
技术实现要素:
5.本说明书实施例的目的是提供一种端到端自动驾驶方法、系统及电子设备。
6.为解决上述技术问题,本技术实施例通过以下方式实现的:
7.第一方面,本技术提供一种端到端自动驾驶方法,该方法包括:
8.分别获取安装于车辆上的相机和激光雷达的相机数据和激光雷达数据;
9.对相机数据和激光雷达数据编码,得到编码器特征;
10.将编码器特征输入第一多层感知机,预测自车的粗粒度的轨迹与控制信号;
11.对粗粒度的轨迹与控制信号进行迭代优化,得到细粒度的轨迹与控制信号。
12.在其中一个实施例中,对相机数据和激光雷达数据编码,得到编码器特征,包括:
13.将相机数据映射为第一鸟瞰图特征;
14.将激光雷达数据映射为第二鸟瞰图特征;
15.将第一鸟瞰图特征和第二鸟瞰图特征合并,得到总鸟瞰图特征;
16.将总鸟瞰图特征由二维摊平成一维,得到编码器特征。
17.在其中一个实施例中,对粗粒度的轨迹与控制信号进行迭代优化,得到细粒度的轨迹与控制信号,包括:
18.基于上一步预测的轨迹,提取第一鸟瞰图特征和第二鸟瞰图特征上轨迹对应坐标的特征,得到观察特征;
19.根据上一步预测的轨迹与控制信号,推测未来时刻场景的状况对应的特征,得到预测特征;
20.将观测特征、预测特征、上一步预测的轨迹与控制信号拼接,得到拼接特征;
21.将拼接特征输入第二多层感知机,得到上一步预测的轨迹与控制信号的修正值;
22.将上一步预测的轨迹与控制信号与修正值相加,作为下一步迭代的输入,直至达到预设迭代次数停止迭代,得到细粒度的轨迹与控制信号。
23.在其中一个实施例中,基于上一步预测的轨迹,提取第一鸟瞰图特征和第二鸟瞰图特征上轨迹对应坐标的特征,得到观察特征,包括:
24.将上一步预测的轨迹中的坐标映射到图片坐标系和点云坐标系,分别得到图片坐标系坐标和点云坐标系坐标;
25.从第一鸟瞰图特征中提取图片坐标系坐标所在位置的第一特征,从第二鸟瞰图特征中提取点云坐标系坐标所在位置的第二特征;
26.将第一特征和第二特征拼接,得到观察特征。
27.在其中一个实施例中,根据上一步预测的轨迹与控制信号,推测未来时刻场景的状况对应的特征,得到预测特征,包括:
28.将上一步预测的轨迹与控制信号与总鸟瞰图特征拼接,得到拼接特征;
29.将拼接特征输入convlstm网络,输出二维的未来鸟瞰图特征;
30.将二维的鸟瞰图特征由二维摊平成一维,得到一维鸟瞰图特征;
31.将一维鸟瞰图特征输入第三多层感知机,得到预测特征。
32.第二方面,本技术提供一种端到端自动驾驶系统,该系统包括:
33.编码器,用于获取安装于车辆上的相机和激光雷达的相机数据和激光雷达数据;并对相机数据和激光雷达数据编码,得到编码器特征;
34.第一多层感知机,用于根据编码器特征,预测自车的粗粒度的轨迹与控制信号;
35.解码器,用于对粗粒度的轨迹与控制信号进行迭代优化,得到细粒度的轨迹与控制信号。
36.在其中一个实施例中,编码器包括:
37.第一主干网络,用于将相机数据映射为第一鸟瞰图特征;
38.第二主干网络,用于将激光雷达数据映射为第二鸟瞰图特征;
39.合并模块,用于将第一鸟瞰图特征和第二鸟瞰图特征合并,得到总鸟瞰图特征;
40.降维模块,用于将总鸟瞰图特征由二维摊平成一维,得到编码器特征。
41.在其中一个实施例中,解码器包括:
42.观察模型,用于提取第一鸟瞰图特征和第二鸟瞰图特征上轨迹对应坐标的特征,得到观察特征。
43.在其中一个实施例中,解码器还包括:
44.预测模型,用于推测未来时刻场景的状况对应的特征,得到预测特征。
45.第三方面,本技术提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现如第一方面的端到端自动驾驶方法。
46.由以上本说明书实施例提供的技术方案可见,该方案:基于已有预测实现轨迹与控制信号由粗粒度到细粒度的迭代,可以降低模型训练的难度与过拟合风险。
附图说明
47.为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或
现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
48.图1为本技术提供的端到端自动驾驶方法的流程示意图;
49.图2为本技术提供的端到端自动驾驶系统的结构示意图;
50.图3为本技术提供的电子设备的结构示意图。
具体实施方式
51.为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
52.以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本技术实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本技术。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本技术的描述。
53.在不背离本技术的范围或精神的情况下,可对本技术说明书的具体实施方式做多种改进和变化,这对本领域技术人员而言是显而易见的。由本技术的说明书得到的其他实施方式对技术人员而言是显而易见得的。本技术说明书和实施例仅是示例性的。
54.关于本文中所使用的“包含”、“包括”、“具有”、“含有”等等,均为开放性的用语,即意指包含但不限于。
55.下面结合附图和实施例对本发明进一步详细说明。
56.参照图1,其示出了适用于本技术实施例提供的端到端自动驾驶方法的流程示意图。
57.如图1所示,一种端到端自动驾驶方法,可以包括:
58.s110、分别获取安装于车辆上的相机和激光雷达的相机数据和激光雷达数据。
59.具体的,车辆上的传感器包括相机和激光雷达,其中,相机可以包括多个。
60.s120、对相机数据和激光雷达数据编码,得到编码器特征,可以包括:
61.将相机数据映射为第一鸟瞰图特征;
62.将激光雷达数据映射为第二鸟瞰图特征;
63.将第一鸟瞰图特征和第二鸟瞰图特征合并,得到总鸟瞰图特征;
64.将总鸟瞰图特征由二维摊平成一维,得到编码器特征。
65.其中,对于多个相机的相机数据,可以使用经典的lss(lift、splat、shoot)方法处理,还可以使用bevformer、bevdepth等方法将相机数据映射为第一鸟瞰图特征。
66.对于激光雷达的激光雷达数据,可以使用经典的second(sparsely embedded convolutional detection,稀疏嵌入式卷积检测)方法得到第二鸟瞰图特征,还可以使用pointpilllars、voxelnet等方法。
67.可以理解的,上述编码过程可以使用其他编码方式,只要最终得到编码器特征即
可。
68.s130、将编码器特征输入第一多层感知机,预测自车的粗粒度的轨迹与控制信号。
69.s140、对粗粒度的轨迹与控制信号进行迭代优化,得到细粒度的轨迹与控制信号,可以包括:
70.基于上一步预测的轨迹,提取第一鸟瞰图特征和第二鸟瞰图特征上轨迹对应坐标的特征,得到观察特征;
71.根据上一步预测的轨迹与控制信号,推测未来时刻场景的状况对应的特征,得到预测特征;
72.将观测特征、预测特征、上一步预测的轨迹与控制信号拼接,得到拼接特征;
73.将拼接特征输入第二多层感知机,得到上一步预测的轨迹与控制信号的修正值;
74.将上一步预测的轨迹与控制信号与修正值相加,作为下一步迭代的输入,直至达到预设迭代次数停止迭代,得到细粒度的轨迹与控制信号。
75.一个实施例中,基于上一步预测的轨迹,提取第一鸟瞰图特征和第二鸟瞰图特征上轨迹对应坐标的特征,得到观察特征,可以包括:
76.将上一步预测的轨迹中的坐标映射到图片坐标系和点云坐标系,分别得到图片坐标系坐标和点云坐标系坐标;
77.从第一鸟瞰图特征中提取图片坐标系坐标所在位置的第一特征,从第二鸟瞰图特征中提取点云坐标系坐标所在位置的第二特征;
78.将第一特征和第二特征拼接,得到观察特征。
79.具体的,基于上一步预测的轨迹中的坐标点,将其映射到各个传感器的坐标系,即图片坐标系和点云坐标系,然后根据在各自传感器坐标系中的坐标,分别从第一鸟瞰图特征和第二鸟瞰图特征中提取坐标所在位置的特征,将从各个传感器中提取出来的特征拼接,称之为观察特征。
80.一个实施例中,根据上一步预测的轨迹与控制信号,推测未来时刻场景的状况对应的特征,得到预测特征,可以包括:
81.将上一步预测的轨迹与控制信号与总鸟瞰图特征拼接,得到拼接特征;
82.将拼接特征输入convlstm网络,输出二维的未来鸟瞰图特征;
83.将二维的鸟瞰图特征由二维摊平成一维,得到一维鸟瞰图特征;
84.将一维鸟瞰图特征输入第三多层感知机,得到预测特征。
85.具体的,将上一步预测的所轨迹与控制信号以及总鸟瞰图特征拼接,输入到一个convlstm网络,输出得到未来鸟瞰图特征,将2d的未来鸟瞰图特征,由二维摊平成一维,然后输入到第三多层感知机中,得到预测特征。
86.本技术实施例提供的端到端自动驾驶方法,基于已有预测实现轨迹与控制信号由粗粒度到细粒度的迭代,可以降低模型训练的难度与过拟合风险。
87.实验验证
88.在carla仿真器中测试了本技术提供的端到端自动驾驶方法,使用了两组公开的端到端驾驶评测规范:town05long与longest6,在两种规范上均大幅度优于已有方法。同时相比于不使用多步迭代优化的基线模型,涨幅在8%左右。
89.参照图2,其示出了根据本技术一个实施例描述的端到端自动驾驶系统的结构示
意图。
90.如图2所示,端到端自动驾驶系统,可以包括:
91.编码器,用于获取安装于车辆上的相机和激光雷达的相机数据和激光雷达数据;并对相机数据和激光雷达数据编码,得到编码器特征;
92.第一多层感知机,用于根据编码器特征,预测自车的粗粒度的轨迹与控制信号;
93.解码器,用于对粗粒度的轨迹与控制信号进行迭代优化,得到细粒度的轨迹与控制信号。
94.编码器包括:
95.第一主干网络,用于将相机数据映射为第一鸟瞰图特征;
96.第二主干网络,用于将激光雷达数据映射为第二鸟瞰图特征;
97.合并模块,用于将第一鸟瞰图特征和第二鸟瞰图特征合并,得到总鸟瞰图特征;
98.降维模块,用于将总鸟瞰图特征由二维摊平成一维,得到编码器特征。
99.解码器包括:
100.观察模型,用于提取第一鸟瞰图特征和第二鸟瞰图上轨迹对应坐标的特征,得到观察特征。
101.解码器还包括:
102.预测模型,用于推测未来时刻场景的状况对应的特征,得到预测特征。
103.本实施例提供的一种端到端自动驾驶系统,可以执行上述方法的实施例,其实现原理和技术效果类似,在此不再赘述。
104.图3为本发明实施例提供的一种电子设备的结构示意图。如图3所示,示出了适于用来实现本技术实施例的电子设备300的结构示意图。
105.如图3所示,电子设备300包括中央处理单元(cpu)301,其可以根据存储在只读存储器(rom)302中的程序或者从存储部分308加载到随机访问存储器(ram)303中的程序而执行各种适当的动作和处理。在ram 303中,还存储有设备300操作所需的各种程序和数据。cpu 301、rom 302以及ram 303通过总线304彼此相连。输入/输出(i/o)接口305也连接至总线304。
106.以下部件连接至i/o接口305:包括键盘、鼠标等的输入部分306;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分307;包括硬盘等的存储部分308;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分309。通信部分309经由诸如因特网的网络执行通信处理。驱动器310也根据需要连接至i/o接口305。可拆卸介质311,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器310上,以便于从其上读出的计算机程序根据需要被安装入存储部分308。
107.特别地,根据本公开的实施例,上文参考图1描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,计算机程序包含用于执行上述端到端自动驾驶方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分309从网络上被下载和安装,和/或从可拆卸介质311被安装。
108.附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代
表一个模块、程序段、或代码的一部分,前述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
109.描述于本技术实施例中所涉及到的单元或模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中。这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定。
110.上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、笔记本电脑、行动电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
111.需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
112.本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
技术特征:
1.一种端到端自动驾驶方法,其特征在于,所述方法包括:分别获取安装于车辆上的相机和激光雷达的相机数据和激光雷达数据;对所述相机数据和所述激光雷达数据编码,得到编码器特征;将所述编码器特征输入第一多层感知机,预测自车的粗粒度的轨迹与控制信号;对所述粗粒度的轨迹与控制信号进行迭代优化,得到细粒度的轨迹与控制信号。2.根据权利要求1所述的方法,其特征在于,所述对所述相机数据和所述激光雷达数据编码,得到编码器特征,包括:将所述相机数据映射为第一鸟瞰图特征;将所述激光雷达数据映射为第二鸟瞰图特征;将所述第一鸟瞰图特征和所述第二鸟瞰图特征合并,得到总鸟瞰图特征;将所述总鸟瞰图特征由二维摊平成一维,得到所述编码器特征。3.根据权利要求2所述的方法,其特征在于,所述对所述粗粒度的轨迹与控制信号进行迭代优化,得到细粒度的轨迹与控制信号,包括:基于上一步预测的所述轨迹,提取所述第一鸟瞰图特征和所述第二鸟瞰图特征上轨迹对应坐标的特征,得到观察特征;根据上一步预测的所述轨迹与控制信号,推测未来时刻场景的状况对应的特征,得到预测特征;将所述观测特征、所述预测特征、上一步预测的所述轨迹与控制信号拼接,得到拼接特征;将所述拼接特征输入第二多层感知机,得到上一步预测的轨迹与控制信号的修正值;将上一步预测的所述轨迹与控制信号与所述修正值相加,作为下一步迭代的输入,直至达到预设迭代次数停止迭代,得到所述细粒度的轨迹与控制信号。4.根据权利要求3所述的方法,其特征在于,所述基于上一步预测的所述轨迹,提取所述第一鸟瞰图特征和所述第二鸟瞰图特征上轨迹对应坐标的特征,得到观察特征,包括:将上一步预测的所述轨迹中的坐标映射到图片坐标系和点云坐标系,分别得到图片坐标系坐标和点云坐标系坐标;从所述第一鸟瞰图特征中提取所述图片坐标系坐标所在位置的第一特征,从所述第二鸟瞰图特征中提取所述点云坐标系坐标所在位置的第二特征;将所述第一特征和所述第二特征拼接,得到所述观察特征。5.根据权利要求3所述的方法,其特征在于,所述根据上一步预测的所述轨迹与控制信号,推测未来时刻场景的状况对应的特征,得到预测特征,包括:将上一步预测的所述轨迹与控制信号与所述总鸟瞰图特征拼接,得到拼接特征;将所述拼接特征输入convlstm网络,输出二维的未来鸟瞰图特征;将所述二维的鸟瞰图特征由二维摊平成一维,得到一维鸟瞰图特征;将所述一维鸟瞰图特征输入第三多层感知机,得到所述预测特征。6.一种端到端自动驾驶系统,其特征在于,所述系统包括:编码器,用于获取安装于车辆上的相机和激光雷达的相机数据和激光雷达数据;并对所述相机数据和所述激光雷达数据编码,得到编码器特征;第一多层感知机,用于根据所述编码器特征,预测自车的粗粒度的轨迹与控制信号;
解码器,用于对所述粗粒度的轨迹与控制信号进行迭代优化,得到细粒度的轨迹与控制信号。7.根据权利要求6所述的系统,其特征在于,所述编码器包括:第一主干网络,用于将所述相机数据映射为第一鸟瞰图特征;第二主干网络,用于将所述激光雷达数据映射为第二鸟瞰图特征;合并模块,用于将所述第一鸟瞰图特征和所述第二鸟瞰图特征合并,得到总鸟瞰图特征;降维模块,用于将所述总鸟瞰图特征由二维摊平成一维,得到所述编码器特征。8.根据权利要求7所述的系统,其特征在于,所述解码器包括:观察模型,用于提取所述第一鸟瞰图特征和所述第二鸟瞰图特征上轨迹对应坐标的特征,得到观察特征。9.根据权利要求6所述的系统,其特征在于,所述解码器还包括:预测模型,用于推测未来时刻场景的状况对应的特征,得到预测特征。10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-5中任一所述的端到端自动驾驶方法。
技术总结
本申请提供一种端到端自动驾驶方法、系统及电子设备,该方法包括:分别获取安装于车辆上的相机和激光雷达的相机数据和激光雷达数据;对相机数据和激光雷达数据编码,得到编码器特征;将编码器特征输入第一多层感知机,预测自车的粗粒度的轨迹与控制信号;对粗粒度的轨迹与控制信号进行迭代优化,得到细粒度的轨迹与控制信号。该方案基于已有预测实现轨迹与控制信号由粗粒度到细粒度的迭代,可以降低模型训练的难度与过拟合风险。型训练的难度与过拟合风险。型训练的难度与过拟合风险。
技术研发人员:李弘扬 贾萧松 陈立 吴鹏浩 谢江炜 严骏驰 乔宇
受保护的技术使用者:上海人工智能创新中心
技术研发日:2023.03.21
技术公布日:2023/6/26
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/
上一篇:底盘防撞击结构的制作方法 下一篇:车辆控制系统、方法及存储介质与流程