分销赏收藏举报申诉 / 11

立即下载开通VIP

当前位置：首页 > 学术论文 > 论文指导/设计 > 基于深度学习的端到端车辆运动规划方法研究.pdf

基于深度学习的端到端车辆运动规划方法研究.pdf

上传人：自信****多点

文档编号：638667

上传时间：2024-01-22

格式：PDF

页数：11

大小：5.08MB

《基于深度学习的端到端车辆运动规划方法研究.pdf》由会员分享，可在线阅读，更多相关《基于深度学习的端到端车辆运动规划方法研究.pdf（11页珍藏版）》请在咨信网上搜索。

1、2023 年（第 45 卷）第 8 期汽车工程Automotive Engineering2023（Vol.45 ）No.8基于深度学习的端到端车辆运动规划方法研究*刘卫国1，2，项志宇1，刘锐2，李国栋3，王子旭2（1.浙江大学信息与电子工程学院，杭州 310058；2.国家智能网联汽车创新中心，北京 100160；3.重庆理工大学车辆工程学院，重庆 400054）摘要在现有端到端的深度学习自动驾驶框架中，普遍存在规划控制预测精度低的问题，这往往是由于输入数据源单一、无法兼顾时间和空间信息而导致的。为更好地体现虚拟仿真测试中自车与环境、交通参与者的历史交互过程对当前时刻决策的影响，本文设计

2、了一种用于自动驾驶仿真环境下车辆运动规划任务的多级时空注意力长短期记忆网络。该算法提取和表征自动驾驶环境的深层抽象信息，并在仿真平台中实现端到端的车辆运动控制。首先，将前视摄像头模型获取的RGB仿真数据的历史连续视频帧序列作为输入，使用卷积模块提取单一时刻图像的空间特征；其次，使用LSTM模块融合图像历史时刻的空间信息，从而获得时间上下文特征。同时，为提高对时空关键信息的提取能力并加速网络收敛，本文在多级时空特征的融合部分采用了时空注意力机制。本研究在Carla仿真平台上进行了测试验证，实验结果表明本文所提出的方法相比单一时空算法更能精确地模仿人类驾驶决策行为。关键词：车辆运动规划；端到端；时

3、空注意力；深度学习；仿真；LSTMResearch on End-to-End Vehicle Motion Planning Method Based on Deep LearningLiu Weiguo1，2，Xiang Zhiyu1，Liu Rui2，Li Guodong3&Wang Zixu21.ZJU College of Information Science&Electronic Engineerings，Hangzhou310058；2.National Innovation Center of Intelligent and Connected Vehicles，Beijin

4、g100106；3.School of Vehicle Engineering CQUT，Chongqing400054Abstract In existing end-to-end deep learning-based autonomous driving frameworks，there is a common problem of low accuracy in planning and control prediction，often due to the single-source input data and inability to balance spatial and te

5、mporal information.To better reflect the impact of the historical interaction process between the ego vehicle，environment，and traffic participants on the current decision-making in virtual simulation testing，this paper designs a multi-level spatiotemporal attention long short-term memory network for

6、 vehicle motion planning in autonomous driving simulation environment.The algorithm extracts and represents deep abstract information of the autonomous driving environment and realizes end-to-end vehicle motion control in the simulation platform.Firstly，a convolutional module is used to extract spat

7、ial features of a single image at a specific moment using the historical continuous video frame sequence of RGB simulation data acquired by the forward-facing camera model as input.Secondly，the LSTM module is used to fuse the spatial information of the image across historical moment to obtain tempor

8、al contextual features.Additionally，to enhance the ability to extract spatiotemporal key information and accelerate network convergence，a spatiotemporal attention mechanism is applied in the fusion part of the multi-level spatiotemporal features.The proposed method is tested and validated on the Car

9、la simulation platform.The experimental results show that the proposed method can more accurately simulate human driving decision-making behavior compared to the single spatiotemporal algorithm.doi：10.19562/j.chinasae.qcgc.2023.08.005*自动驾驶国家新一代人工智能开放创新平台项目（2020AAA0103702）资助。原稿收到日期为2023年04月28日，修改稿收到日

10、期为2023年06月18日。通信作者：项志宇，教授，博士（后），E-mail：。汽车工程2023 年（第 45 卷）第 8 期Keywords：vehicle motion planning；end-to-end；space-time attention；deep learning；simulation；LSTM前言自动驾驶技术是近年来的研究热点，能够有效地提高行驶安全性、缓解交通拥堵、降低能耗。目前最常用的方法是将自动驾驶问题划分为传感器感知融合、车道检测、路径规划和控制执行等不同的子模块，这种模块化的方法虽然可以使车辆实现简单的自动驾驶，但可能导致整个系统的复杂性增加。另一种方法是基于深度

11、神经网络的端到端自动驾驶框架，这种方法将所有传感器原始数据作为输入，网络模型直接为车辆生成最终控制指令。该方法在降低复杂性的同时减少了不同领域所需的知识门槛。近年来，深度学习已被广泛应用于自动驾驶领域。Pomerleau提出了Alvinn1，其在车道跟随方面已得出不错的实验结果，可以仅使用单帧图像作为输入来预测转向角度。相比于车道跟随，城市驾驶任务引入了很多新问题，城市道路上的交通环境复杂，需要考虑自车与目标车、行人的交互，而单帧图像无法为模型提供足够的信息来预测下一步决策，从而产生了对时间信息的需求。此外，单帧图像信息也无法充分表征复杂的交通流信息以及历史连续驾驶行为对当前时刻的影响。为了解

12、决城市驾驶任务中交通环境复杂的问题，Codevilla等2提出了条件模仿学习，该方法通过专家意图来指导模型的学习，但该算法只能处理极少部分城市工况。同时，每个网络分支仅根据专家意图在城市驾驶场景的一个子集上进行训练，难以覆盖所有城市道路工况。首先，由于决策动作在后续视频帧中并不连续3，这使得车辆在行驶过程中出现小幅振荡；其次，该方法需要大量的训练数据，且整个训练时间过长。为了改善上述问题，本文提出了一种替代架构。该架构首先从安装在自车前部的摄像头获取原始RGB图像序列，并进行数据预处理工作以增加数据的多样性。然后将预处理后的数据输入预训练网络进行训练，使用卷积模块提取必要的特征以学习适当的控制

13、参数。在卷积层之后，使用LSTM网络整合系统的时空上下文信息，LSTM 网络旨在记住自车、交通参与者和道路的历史状态。最后，时空注意力模块可以通过在LSTM网络层引入注意力机制来实现，根据当前输入的图像和历史状态，计算出一个权重向量，该向量可以被用于对历史状态进行加权求和，从而得到一个更加关注重要历史状态的表示。而后，将学习到的特征与必要的车辆状态信息联接起来，将联接后的向量输入全连接层，最终学习并预测连续的转向角、制动和油门。本文提出了一种基于深度学习端到端的车辆运动规划仿真方法，该方法遵循端到端的框架，直接从原始图像序列中学习车辆控制策略。具体贡献如下：（1）提出了一种基于端到端规控框架的

14、多级时空注意力长短期记忆网络，该网络通过注意力机制整合历史时序中帧间的时空关联信息，从而实现车辆运动规划的端到端学习。（2）提出了一种基于过滤和扩充的数据平衡方法，在有效增加了有限数据集的多样性的同时，平衡了不同场景的数据分布。1方法论1.1问题定义为探索不同架构的性能以及架构在不同组件下的表现，从而研究端到端模型的自动驾驶能力，本节提出了一种基于深度神经网络的端到端模型，通过训练此模型以模仿专家驾驶行为。本文构建了模仿学习机制，其中模型将前向视景Oi、用户意图hi和外部状态信息为模型输入。其中，用户导航意图hi的one-hot编码向量，称为导航输入；外部环境的附加状态信息，例如当前车辆限速、

15、车速和当前的红绿灯状态，由外部状态信息si引入。改进后的模仿学习技术如式（1）所示，其中模型F通过拟合可学习参数来学习输入（即oi、hi、si）和执行动作ai之间的映射，以使损失L最小化。miniL(F(oi，hi，si；)，ai)（1）1.2系统描述图1展示了训练阶段的流程框架。下部黑色虚线框代表不同历史时刻的前视摄像头输入序列所构成的滑动窗，中部为网络模型示意图和网络训练模 13442023（Vol.45）No.8刘卫国，等：基于深度学习的端到端车辆运动规划方法研究式流程图，包括油门制动预测和转向预测，上部红色虚线框为与训练时间同步的真值序列主要包括转向角、制动、油门。在转向预测模块中，网

16、络输出通过分类层，产生正弦转向预测。在训练阶段，分类层的输出与正弦编码的地面实况转向角之间的损失使用RMSE损失函数计算，如式（2）所示，其中，yi表示预测值，yi表示真实值。训练后，当系统处于测试部署阶段时，转向预测通过解码器生成转向角。RMSE=1ni=1n(yi-yi)2（2）在油门制动预测中，网络输出通过全连接层来预测油门和制动值。在训练期间，使用MSE均方误差损失函数计算预测值和真值之间的损失，如式（3）所示。在部署测试阶段，预测模块的输出会产生最终的油门和制动预测。MSE=1ni=1n(yi-yi)2（3）1.3网络架构针对图1中的网络模型部分，本文设计了4种不同架构，分别是：单一

17、时空卷积网络（single CNN，SiNN）、融合时空卷积网络（fusion CNN，FuNN）、长短期记忆卷积网络（LSTM CNN，LsNN）以及多级时空注意力卷积网络（attention LSTM CNN，AtLN），以对比论证自车与环境、交通参与者的历史交互过程对当前时刻决策的影响。1.3.1单一时空卷积网络单一时空卷积网络模型，仅根据当前时刻的自车与环境的交互信息进行决策规划，即仅将当前时刻的单帧图像作为输入，并通过CNN进行前馈，网络模型的完整体系结构如图2所示。1.3.2融合时空卷积网络融合时空卷积网络根据自车与环境、交通参与者的历史交互过程对当前过程进行决策输出，以等权重融合

18、多个时间步长的信息。如图3所示，该网络在多个平行的CNN级别中应用不同的时空输入信息，以有效提取每个时刻空间下不同外部状态的不同特征。其中包含n个级别的CNN，n的大小与滑动窗体内的序列长度一致，每个CNN具有相同的结构和不同时刻的输入。此处使用concatente进行特征融合，但是也表现出训练收敛速度慢且参数量较大的缺点。1.3.3长短期记忆卷积网络长短期记忆卷积网络模型如图4所示，根据自车与环境、交通参与者的历史交互过程对当前过程进行决策输出，采用直接递归混合预测输出。该网络使用与FuNN相同的特征提取结构，但其特征是按时间分布的，本模型与FuNN的不同之处在于卷55!.1#1#ELN#N

19、#KBKBG!-E L?RGBgggggggggggg-%0tn ty GA4GA4G yt2tyttytyttxtLtxtL1)txtL2)txttxtL3)t图1训练阶段的系统框架 1345汽车工程2023 年（第 45 卷）第 8 期积层和分类器之间添加了一个具有10个隐藏状态的 LSTM 模块。卷积层的一系列输出被送入 LSTM模块，每个时间步长产生的隐藏状态被连接到序列的下一个输入。在时间步t，输出被引导到分类器中输出转向、油门和制动。1.3.4多级时空注意力长短期记忆网络多级时空注意力长短期记忆网络，根据自车与环境、交通参与者的历史交互过程对当前过程进行决策输出，为不同历史时刻的输

20、入空间特征赋予不同的重要性并按照时间序分布，即使用注意力机制学习历史序列中不同时空的权重，在本文中，使用“软”注意力4的建模方式。如图5所示，AtLN包括CNN、LSTM和空间注意力模块。在时间步t，假设CNN层产生一组d个大小为nm的特征图，vitLi=1，vitD，L=m n，每个区域向量对应于CNN在不同图像区域提取的特征。在软注意力机制中，假设上下文向量zt由所有区域向量 vitLi=1的加权和表示：zt=i=1Lgit vit（4）权重git是根据区域向量的重要性来选择的，它是由注意力网络g学习得到的。注意力网络g将LSTM层产生的区域向量vit和隐藏状态h(t-1)作为输入，并输出

21、区域向量vit的对应权重。该注意力网络g是一个全连接层，其后跟着一个softmax函数：giL=softmax(wv vil+wh ht-1)，i=1，T（5）式中上下文向量zt输入到LSTM层。LSTM层的输出与全连接层相连，用于生成最终油门、转向盘转角和制动踏板值。注意力网络可以解释为CNN特征图上的掩码，0555314824055257236055113448033516640333146405511264E03003081Flatten17681107LF1100E13ELFFLF&85H/85H/85H/85H/85H/85H/85H/85H/85H/85H/85H/85H/8&UR

22、S1RUPLF150LF110LF1100 图2单一时空卷积网络模型ggggggggg0/455LFFF6FEEFlattenFlattenFlattenggggggggggggF x(tn)x(t)x(t)f(tn)f(t)f(t)f(tn)f(t)f(t)图3融合时空卷积网络模型 13462023（Vol.45）No.8刘卫国，等：基于深度学习的端到端车辆运动规划方法研究它重新加权区域特征以获得最有用的特征。因此，多级时空注意力长短期记忆模型在做出驾驶决策时获得了选择和关注重要区域的能力。此外，也有助于减少网络中的参数量，以实现更快的模型训练和收敛。1.4角度分类转向角预测通常根据传感器输

23、入来预测连续的转向角度；另一种方法则是将问题定义为分类任务，通过网络预测属于每个转向角区间的概率。本文按照与Eraqi等5相同的设置，将包含10个神经元的分类层引入转向预测模块的末端。此外，将tanh激活应用于分类层，允许神经元形成振幅为1的正弦波。原始转向角对应于正弦波的相移。在训练过程中，真值转向角使用式（6）编码为正弦值。Yi是输出神经元i的编码目标值，是原始转向角，max是最大可能的原始转向角。预测损失为预测波形和编码的真值波形之间的RMSE值。在部署期间，分类层的输出被解码回转向角。解码通过将分类层的输出拟合为正弦函数并返回其相移来完成：Yi()=sin()2(i-1)10-1-2m

24、ax，1 i 10（6）ggggggggg#ggggggggggggK.A550/455FF6FEEx(tn)x(t)x(t)h(tn)h(t)h(t)z(tn)z(t)z(t)vt-ni=1iLvt-ni=1iLvt-ni=1iLgtigt1igtni图5多级时空注意力长短期记忆网络模型K.A55gggggggggggggggggg0/455FF6FEEx(tn)x(t)x(t)f(tn)f(t)f(t)f(tn)f(t)f(t)h(tn)h(t)h(t)h(tn)h(t)h(t)图4长短期记忆卷积网络模型 1347汽车工程2023 年（第 45 卷）第 8 期2实验设置本研究使用的三阶段实

25、验流程如图6所示。2.1实验环境实验软硬件相关配置参数如表1所示。2.2数据获取仅在理想环境中使用专家数据训练的模型可能无法学习如何从干扰中恢复，为解决这个问题，本文采用了多种类型的驾驶行为数据，使用 Carla 的Autopilot6控制模式获取专家驾驶行为数据，从而在正确保持速度限制的同时实现车道中心驾驶。为获取更多不稳定的数据，在Autopilot的输出控制信号中添加了一个随机生成的噪声值。这有可能导致车辆轨迹和速度的突然变化，并由Autopilot进行纠正。为消除训练集中误操作行为的影响，只收集了Autopilot对噪声的响应。最后，手动将车辆置于危险位置（例如驶向对向车道）来获得从偶

26、发事故状态中纠偏的数据。如图7所示，本文基于Carla中仿真地图Town01和 Town07的多条验证路径完成训练数据采集。一部分训练数据是在没有任何其他车辆的情况下获取的，另一部分数据则是通过随机生成一定数量（100200）的其他车辆来获取的。本研究在中午和傍晚分别针对7种不同的天气条件进行了数据收集，包括晴天、阴天、小雨、中雨、大雨、雨后晴天以及多云潮湿，共计14种不同的天气/时间组合。图8展示了在中午和傍晚时不同天气条件下的部分示例。表 2中列出并描述了从 Carla中获取的不同类型的数据。每个传感器模型由仿真中单个渲染帧的数据组成，并以10 Hz的频率抓取数据。本研究共收集了3.4 h

27、的训练数据，其中Town 01占2.4 h，Town 07占1.0 h。在数据预处理阶段，首先将采集的图像需要下采样到180300像素。其次，对于可分类的数据，如行驶方向和速度限制及交通灯状态，使用one-hot编码进行预处理。为了避免模型只学习方向和转向之间的关系，对于交叉路口的方向命令，最多添加30个时间步。此外，为了获取更多样本，将噪声注图6本研究的三阶段实验流程表1实验设置计算机配置CPUGPUOSDriverCUDACPU虚拟环境配置Environment management systemPython distributions机器学习工具Tensorflow-gpuKerasN

28、umpyPandasSimulatorIntel（R）Core（TM）i7-8700K CPU 3.70 GHzIntel（R）Core（TM）i7-8700K CPU 3.70 GHzGeForce GTX 3090 TiUbuntu 18.04NVIDIA version 470Version 11Client side：2.7.16 Server side：3.7.1Version 1.13.1Version 2.2.4Version 1.15.1Version 0.24.2Carla 0.9.5Conda 4.5.12 图7Carla中仿真地图Town01、Town07及其验证路径图8

29、不同天气光照模拟结果 13482023（Vol.45）No.8刘卫国，等：基于深度学习的端到端车辆运动规划方法研究入数据中以让车辆自行纠偏。此外，还强制车辆在短时间内向右或向左行驶，然后由 Autopilot 进行纠偏。2.3数据增强在端到端学习框架中，数据集中目标值分布的均衡性是一个非常重要的影响因素。如果在不平衡的数据集上训练模型，可能会因错误的引导而偏好某些决策。为了解决这个问题，通常通过过滤或扩充数据样本以平衡数据集。然而，在递归网络中，保持数据集的时间信息非常重要。因此，本研究使用并对比了两种数据增强方法。第一种数据扩充平衡方法通过复制和重组数据来保留尽可能多的时间信息。本研究将数据

30、集中的每一轮分割成5个片段池：直道、左转、右转、直线车道跟随和车道跟随弯道。然后，通过从其中一个片段池中随机选择一个片段来构建平衡数据集。这些选择是基于加权选择和数据重组完成的7，并根据每个池的平均段长度与最高平均段长度的比较确定权重，从而更多地扩充具有较少信息的场景类型。规定转向归一化变量介于-1和1之间，转向阈值高于0.5 的样本进行 5 倍上采样，阈值 0.1-0.5 的样本进行2倍上采样；红绿灯制动样本3倍上采样，限速60 km/h的样本3倍上采样，限速90 km/h的样本2倍上采样。使用池中的所有场景片段后，该类型的选择将重新开始。该方法可以保留时间信息，但需要进行数据重复。第二种数

31、据平衡方法则没有数据重复。将数据集分成用于训练的正确序列长度的片段，这些片段由其最主要的导航命令表示。然后，在定序器中过滤丢弃并重组来实现数据集的平衡3，对于车辆静止或转向角为0的数据，采用0.7-0.9的阈值过滤去除此类数据。该方法不会干扰时间信息，但可能会在定序器中引入某些偏差。两种平衡方法的结果如图9所示。如图10（a）所示，可以发现平衡前的转向角数据呈现出极不平衡的分布，而经过了上述的过滤和扩充操作后，最终产生了如图 10（b）所示的分布情况。此外，本文还对图像样本进行了包括亮度变化、高斯噪声、高斯模糊、灰度变化、对比度增强等模拟8，如图11所示。为了确保每次提取图像时都以不同的方式增

32、强图像，本文会设置每次增强的概率和程度。从弱到强的增强形式为：软、中软、中、中硬、硬和超硬。表2从Carla获取的不同类型数据数据前视摄像头图像速度速度限制位置车辆控制信号建议控制信号交通信号灯状态导航信号输入驾驶环境天气标识数据描述来自车辆前置中央摄像头的图像车辆的当前速度（m/s）车辆所在位置的速度限制（km/h）车辆的位置，x-cord，y-cord车辆控制信号，steer，throttle，brakeCarla自动驾驶仪建议的控制信号，steer，throttle，brake车辆位置的交通灯状态：Green（1），Red（0）激活的导航输入：Turn Left，Turn Right S

33、traight Ahead，Continue Straight，Change Lane Left，Change Lane Right仿真驾驶环境：Highway，RuralSun position presetsWeather condition presetsSun attitudeSun azimuthClouds amountRain amountPuddles amountWind intensityFog intensityFog Distance数据格式PNGintfloat，floatfloat，float，floatfloat，float，floatintintintintsu

34、nset|day|nightclear|overcast|rainint，intint，intint，intint，intint，intint，intint，intint，int 1349汽车工程2023 年（第 45 卷）第 8 期3实验结果3.1实验1：数据集平衡的效果3.1.1实验设置第一个实验旨在从2.3节描述的两种方法中找出最佳的数据平衡策略。在同一数据集上训练了3个模型，分别采用了不同的数据平衡策略：不使用数据平衡技术、使用过滤方法和使用扩充方法。在时间分布型网络LsNN和AtLN中，综合考虑模型训练效率和收敛速度，本实验采用第1.3.3节中描述的LsNN模型进行验证，并通过模型单

35、次实时测试运行的性能来衡量。3.1.2实验结果表3的结果表明，在平衡后数据集上训练的模型比平衡前的表现要好得多。使用扩充平衡的训练模型在12k步后达到了37.19%的平均性能，而使用过滤平衡的模型仅完成了20.89%。扩充平衡模型在达到24k训练步数之后，其测试结果在傍晚光照条件下表现更好，但在中午光照条件下表现更差。表4的实验结果表明：未经平衡训练的模型往图9数据平衡前、过滤后以及扩充后训练集的各个场景占比情况图10训练集中转向角分布的直方图PCF 23&L 图11图像增强效果 13502023（Vol.45）No.8刘卫国，等：基于深度学习的端到端车辆运动规划方法研究往会忽略导航命令；使用

36、过滤平衡方法的模型则主要是因为驶入对向车道而失败。此外，还有发生物体碰撞的可能，虽然没有直接导致测试失败，但可能会导致车辆被卡住，从而结束本回合测试。另外，在采用过滤平衡的数据集上训练的模型表现较差，这可能与数据集规模过小有关。3.2实验2：分类与直接回归3.2.1实验设置本实验旨在比较直接回归和正弦编码分类的相关特性，训练了两个模型：LsNN和LsNN+sine。两个模型都使用了长度为10的序列，并进行了23k步的训练。3.2.2实验结果表5中的实验结果表明，正弦编码架构的性能优于直接回归，平均完成了70.21%的路线，而直接回归只完成了41.88%。值得注意的是，正弦编码模型在不同天气条件

37、下的表现更加一致。表6展示了每个模型在测试中发生的失败类型和对应次数。正弦编码模型的大多数失败是由于它忽略了给定的导航命令，而整体错误数比直接回归少。综上所述，正弦编码模型的表现明显比回归模型更稳定。3.3实验3：不同架构方面的效果3.3.1实验设置本实验旨在通过消融实验来确定自车与环境、交通参与者的历史交互过程对当前时刻决策的影响，以及时间和空间信息对模型的影响，并探究使用时空注意力机制是否对任务产生正向影响。为达到消融实验目的，本实验根据1.3节训练了4个不同的模型。3.3.2实验结果根据表7的实验结果，SiNN模型的性能表现最差，平均只完成了17.39%的路线。实际上，在几乎所有天气条件

38、下的表现都只有15.79%，除了在“大雨&中午”的情况下达到了 30.47%。FuNN 模型表现倒数第二，平均完成率为 38.01%。而 LsNN 和AtLN模型表现出对时间维度信息的依赖，其平均完成率分别为 70.21%和 72.35%。从表 8 中可以看出，SiNN和FuNN模型的失败大多是由于忽略导航命令导致的，其驾驶表现非常不稳定，在转弯处转弯半径过大导致驶入对面车道无法恢复。由于缺少时间维度信息，且复杂度较低，SiNN和FuNN无法学习比车道跟随更复杂的导航场景。表3使用不同平衡方法的路线平均完成情况数据平衡方法无无过滤过滤扩充扩充扩充训练步数12 93820 2416 15811

39、2366 06412 06824 137晴天&中午15.79%10.22%17.85%30.10%36.45%33.66%13.91%晴天&傍晚15.79%38.00%16.53%10.22%38.00%44.98%63.92%大雨&中午21.32%15.28%26.65%13.51%10.22%22.71%30.10%小雨&中午15.79%17.85%15.79%11.96%15.79%64.17%38.00%阴天&傍晚15.79%33.66%16.53%33.66%29.20%20.87%63.92%平均15.78%23.03%18.45%20.89%25.76%37.19%41.88%表

40、4使用不同平衡方法的总失败次数数据平衡方法无无过滤过滤扩充扩充扩充训练步数12 93820 2416 15811 2366 06412 06824 137障碍物碰撞66137353卡死4274332车道入侵无恢复55711435车道入侵并恢复0156122无视指令6610753表5使用和不使用正弦编码的路线平均完成情况模型LsNNLsNN+sine训练步数23 93623 936晴天&中午13.91%79.61%晴天&傍晚63.92%84.91%大雨&中午30.10%40.43%小雨&中午38.00%66.14%阴天&傍晚63.92%75.53%平均41.88%70.21%表6使用和不使用正弦

41、编码的总失败次数模型LsNNLsNN+sine训练步数23 93623 936障碍物碰撞66卡死64车道入侵无恢复51车道入侵并恢复22无视指令36 1351汽车工程2023 年（第 45 卷）第 8 期如图12所示，AtLN模型在约25个训练周期后实现了0.1的损失。在验证损失方面，其最佳结果出现在 30 个训练周期之后，验证损失为 0.083 2。通过实验对比数据，证明了时间维度信息和注意力机制对于车辆运动控制任务产生了正向影响。如图13和图14所示，对于连续变道和车道保持工况，因为车辆不能瞬间改变转向角度，所以车辆实际转向并没有神经网络直接输出那么剧烈。与此相反，智能体可以比较准确地模仿

42、人类驾驶行为。智能体需要具备一定的实时交互能力，以便在路况变化时及时做出反应，更好地适应城市交通环境，并提高行驶的舒适度和安全性。表7不同架构的道路平均完成率模型SiNNFuNNLsNNAtLN训练步数22 44022 13223 93624 256晴天&中午15.79%34.50%79.61%78.23%晴天&傍晚15.79%38.20%84.91%84.03%大雨&中午30.47%40.80%40.43%42.35%小雨&中午15.79%41.10%66.14%68.24%阴天&傍晚15.79%30.90%75.53%77.33%平均17.39%38.01%70.21%72.35%表8使用

43、不同架构的总失败次数模型SiNNFuNNLsNNAtLN训练步数22 44022 13223 93624 256障碍物碰撞5341卡死6441车道入侵无恢复7221车道入侵并恢复0246无视指令10783图12时空上模型的训练损失和验证损失图14车辆在车道保持中的速度与转向角变化曲线图13车辆在连续变道中的速度与转向角变化曲线（下转第1361页）13522023（Vol.45）No.8连静，等：基于车道目标引导的车辆轨迹预测 10 DEO N，WOLFF E，BEIJBOM O.Multimodal trajectory prediction conditioned on lane-graph

44、 traversals C.Conference on Robot Learning（CoRL）.PMLR，2022：203-212.11 ZHANG L，LI P L，CHEN J，et al.Trajectory prediction with graph-based dual-scale context fusion C.International Conference on Intelligent Robots and Systems（IROS）.IEEE，2022：12 GU J R，SUN C，ZHAO H.DenseTNT：end-to-end trajectory predic

45、tion from dense goal sets C.Proceedings of the IEEE/CVF International Conference on Computer Vision（ICCV）.IEEE，2021：15303-15312.13 VARADARAJAN B，HEFNY A，SRIVASTAVA A，et al.Multipath+：efficient information fusion and trajectory aggregation for behavior prediction C.International Conference on Robotic

46、s and Automation（ICRA）.IEEE，2022：7814-7821.14 HUANG G，SUN Y，LIU Z，et al.Deep networks with stochastic depth C.European Conference on Computer Vision（ECCV）.Springer，2016：646-661.15 TOUVRON H，CORD M，SABLAYROLLES A，et al.Going deeper with image transformers C.Proceedings of the IEEE/CVF International C

47、onference on Computer Vision（ICCV）.IEEE，2021：32-42.16 CHANG M F，LAMBERT J，SANGKLOY P，et al.Argoverse：3D tracking and forecasting with rich maps C.Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition（CVPR）.IEEE，2019：8748-8757.17 LOSHCHILOV I，HUTTER F.Decoupled weight deca

48、y regularization C.International Conference on Learning Representations（ICLR）.OpenReview，2018.18 CHAI Y N，SAPP B，BANSAL M，et al.MultiPath：multiple probabilistic anchor trajectory hypotheses for behavior prediction C .Conference on Robot Learning（CoRL）.PMLR，2020：86-99.19 YE M S，CAO T Y，CHEN Q F.Tpcn：

49、temporal point cloud networks for motion forecasting C.Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition（CVPR）.IEEE，2021：11318-11327.20 LIU Y C，ZHANG J H，FANG L J，et al.Multimodal motion prediction with stacked transformers C.Proceedings of the IEEE/CVF Conference on

50、Computer Vision and Pattern Recognition（CVPR）.IEEE，2021：7577-7586.21 DA F，ZHANG Y.Path-aware graph attention for HD maps in motion prediction C.International Conference on Robotics and Automation（ICRA）.IEEE，2022：6430-6436.4结论本文提出了一种用于自动驾驶端到端仿真的多级时空注意力长短期记忆网络，旨在解决现有端到端的深度学习自动驾驶框架中预测精度低的问题，以便更好地体现虚拟仿真

下载提示：咨信网仅提供存储空间/不修改/不编辑

【自信AI创作助手】【自信AI导航】
1、请仔细预览页面，基本判断完整性，对于直接下载带来的问题请及时与客服沟通；下载的文档，不会出现我们的网址水印。
2、该文档所得收入（下载+内容+预览）归上传者、原创作者；如果您是本文档原作者，请点此认领！既往收益都归您。

同意并开始全文预览

举报此文档有问题？有机会获“体验VIP”奖励！

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

10 金币 0人已下载

申诉本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请申请举报、认领或删除 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 基于深度学习端到端车辆运动规划方法研究

咨信网温馨提示：
1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时私信或留言给本站上传会员【自信****多点】，需本站解决可联系【微信客服】、【 QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”（推荐），意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：4008-655-100；投诉/维权电话：4009-655-100。