欢迎来到咨信网! | 成为共赢成为共赢 咨信网助力知识提升 | 自信网络旗下运营:咨信网 自信AI创作助手 自信AI导航
咨信网
全部分类
  • 包罗万象   教育专区 >
  • 品牌综合   考试专区 >
  • 管理财经   行业资料 >
  • 环境建筑   通信科技 >
  • 法律文献   文学艺术 >
  • 学术论文   百科休闲 >
  • 应用文书   研究报告 >
  • ImageVerifierCode 换一换
    首页 咨信网 > 资源分类 > PDF文档下载
    分享到微信 分享到微博 分享到QQ空间

    基于贝叶斯网络构建RoboSim模型的自动驾驶行为决策.pdf

    • 资源ID:636835       资源大小:8.12MB        全文页数:17页
    • 资源格式: PDF        下载积分:10金币
    微信登录下载
    验证码下载 游客一键下载
    账号登录下载
    三方登录下载: QQ登录
    二维码
    微信扫一扫登录
    下载资源需要10金币
    邮箱/手机:
    验证码: 获取验证码
    温馨提示:
    支付成功后,系统会自动生成账号(用户名为邮箱或者手机号,密码是验证码),方便下次登录下载和查询订单;
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    开通VIP
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    声明    |    会员权益      获赠5币      写作写作
    1、填表:    下载求助     索取发票    退款申请
    2、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
    3、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
    4、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
    5、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
    6、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
    7、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。

    基于贝叶斯网络构建RoboSim模型的自动驾驶行为决策.pdf

    1、基于贝叶斯网络构建 RoboSim 模型的自动驾驶行为决策*陈洁娜1,2,3,张铭茁1,2,3,杜德慧1,2,3,李博1,2,3,聂基辉1,2,3,任婧瑶1,2,31(华东师范大学软件工程学院,上海200062)2(上海市高可信重点实验室(华东师范大学),上海200062)3(教育部可信软件国际合作联合实验室(华东师范大学),上海200062)通信作者:杜德慧,E-mail:摘要:为汽车自动驾驶提供安全高效的自动驾驶行为决策,是汽车自动驾驶领域面临的挑战性问题之一.目前,随着自动驾驶行业的蓬勃发展,工业界与学术界提出了诸多自动驾驶行为决策方法,但由于汽车自动驾驶行为决策受环境不确定因素的影响,

    2、决策本身也要求实效性及高安全性,现有的行为决策方法难以完全支撑这些要素.针对以上问题,提出了一种基于贝叶斯网络构建 RoboSim 模型的自动驾驶行为决策方法.首先,基于领域本体分析自动驾驶场景元素之间的语义关系,并结合 LSTM 模型预测场景中动态实体的意图,进而为构建贝叶斯网络提供驾驶场景理解信息;然后,通过贝叶斯网络推理特定场景的自动驾驶行为决策,并使用RoboSim 模型的状态迁移承载行为决策的动态执行过程,以减少贝叶斯网络推理的冗余操作,提高了决策生成的效率.RoboSim 模型具有平台无关、能模拟仿真执行周期的特点,并支持多种形式化的验证技术.为确保行为决策的安全性,使用模型检测工

    3、具UPPAAL 对 RoboSim 模型进行验证分析.最后,结合变道超车场景案例,进一步证实所提方法的可行性,为设计安全、高效的自动驾驶行为决策提供了一种可行的途径.关键词:汽车自动驾驶;行为决策;贝叶斯网络;RoboSim;UPPAAL中图法分类号:TP18中文引用格式:陈洁娜,张铭茁,杜德慧,李博,聂基辉,任婧瑶.基于贝叶斯网络构建RoboSim模型的自动驾驶行为决策.软件学报,2023,34(8):38363852.http:/ Driving Behavior Decision-making with RoboSim Model Based on BayesianNetworkCHEN

    4、Jie-Na1,2,3,ZHANGMing-Zhuo1,2,3,DUDe-Hui1,2,3,LIBo1,2,3,NIEJi-Hui1,2,3,RENJing-Yao1,2,31(SoftwareEngineeringInstitute,EastChinaNormalUniversity,Shanghai200062,China)2(ShanghaiKeyLaboratoryofTrustworthyComputing(EastChinaNormalUniversity),Shanghai200062,China)3(MOEInternationalJointLabofTrustworthySo

    5、ftware(EastChinaNormalUniversity),Shanghai200062,China)Abstract:The realization of safe and efficient behavior decision-making has become a challenging issue for autonomous driving.Asautonomousdrivingindustriesdevelopvigorously,industrialprofessionalsandacademicmembershaveproposedmanyautonomousdrivi

    6、ngbehavior decision-making approaches.However,due to the influence of environmental uncertainties as well as requirements foreffectivenessandhighsecurityofthedecision,existingapproachesfailtotakeallthesefactorsintoaccount.Therefore,thisstudyproposesan autonomous driving behavior decision-making appr

    7、oach with the RoboSim model based on the Bayesian network.First,based on*基金项目:国家自然科学基金(61972153);科技部重点项目(2020AAA0107800)本文由“智能系统的分析和验证”专题特约编辑明仲教授、张立军教授和秦胜潮教授推荐.收稿时间:2021-09-05;修改时间:2021-10-14;采用时间:2022-01-10;jos 在线出版时间:2022-01-28CNKI 网络首发时间:2023-01-19软件学报ISSN1000-9825,CODENRUXUEWE-mail:Journal of So

    8、ftware,2023,34(8):38363852doi:10.13328/ki.jos.006594http:/中国科学院软件研究所版权所有.Tel:+86-10-62562563domainontology,thestudyanalyzesthesemanticrelationshipbetweenelementsinautonomousdrivingscenariosandpredictstheintentionofdynamicentitiesinscenariosbytheLSTMmodel,soastoprovidedrivingscenarioinformationforest

    9、ablishingtheBayesiannetwork.Next,theautonomousdrivingbehaviordecision-makinginspecificscenariosisinferredbytheBayesiannetwork,andthestatetransitionoftheRoboSimmodelisemployedtocarrythedynamicexecutionofbehaviordecision-makingandeliminatetheredundantoperationoftheBayesiannetwork,thusimprovingtheeffic

    10、iencyofdecision-making.TheRoboSimmodelisplatform-independent.Inaddition,itcansimulate the decision-making cycle and support validation technologies in different forms.To ensure the safety of the behavior decision-making,this study uses a model checking tool UPPAAL to verify and analyze the RoboSim m

    11、odel.Finally,based on lane change andovertaking cases,this study validates the feasibility of the proposed approach and provides a feasible way to achieve safe and efficientautonomousdrivingbehaviordecision-making.Key words:autonomousdriving;behaviordecision-making;Bayesiannetwork;RoboSim;UPPAAL近年来,

    12、自动驾驶引起了学术界和工业界的广泛关注.自动驾驶系统(autonomousdrivingsystem,ADS)包含“感知-决策-执行”这 3 大模块1,其中决策模块对感知模块获取的数据进行分析,并根据车辆自身状态及周围环境信息做出当前驾驶场景下的最优决策,然后将相应的指令传输给执行模块,以执行具体的决策动作.决策的优劣将直接影响自动驾驶的安全,因此研究高效可靠的行为决策方法对自动驾驶技术的发展具有重要的意义.目前,由于自动驾驶行为决策的失效引发了一系列安全事故.例如,2021 年 3 月 11 日,一辆特斯拉 ModelY在美国底特律西南部一个十字路口撞上一辆正在行驶的车辆,而该自动驾驶车辆未

    13、采取任何减速或制动的行为决策2.这说明生成安全可信的行为决策作为自动驾驶中的关键技术仍面临诸多挑战.首先,自动驾驶场景具有高度的复杂性与不确定性3,如道路路网结构的复杂性、环境因素的多样性以及其他车辆、行人意图的不确定性等.因此,对自动驾驶场景元素之间的语义关系进行分析,并在决策算法中充分考虑环境的不确定性因素,是影响行为决策准确性的关键所在4.其次,自动驾驶车辆在行驶过程中应考虑决策执行的高效性,即对复杂的环境信息及时做出响应,并生成安全的行为决策.在同一自动驾驶场景中,驾驶车辆的状态以及周围的环境信息在一段连续时间内保持一致,若重复执行决策算法势必会产生诸多冗余计算.因此,如何对同一场景下

    14、的决策进行优化、重用,是提高决策生成效率的关键.此外,保证自动驾驶行为决策的安全性是自动驾驶车辆需考虑的首要问题.在行驶过程中,自动驾驶车辆会与其他交通参与者发生行为交互,错误的决策将造成严重的后果.因此,对自动驾驶决策的安全性进行验证分析也是目前亟需解决的问题之一.针对上述自动驾驶行为决策生成存在的问题,本文提出了一种基于贝叶斯网络构建 RoboSim 模型的自动驾驶行为决策方法.首先,利用领域本体5对驾驶场景中的语义关系进行分析,并构建基于长短期记忆网络(longshorttermmemory,LSTM)的他车意图预测模型6,为构建面向 ADS 行为决策的贝叶斯网络提供场景理解信息并利用贝

    15、叶斯网络进行最大后验概率推理得到当前场景下的最优决策.其次,以该场景下的车辆状态为状态节点,以贝叶斯网络生成的最优决策为迁移边上的动作,环境因素为迁移边上的条件,构建面向 ADS 行为决策的RoboSim7模型;结合我们前期的工作8,将 RoboSim 模型自动转化为 UPPAAL9支持的时间自动机网络(networkoftimedautomata,NTA),借助模型检测技术验证分析 RoboSim 模型的安全性.若通过验证,则使用 RoboSim 模型进行决策,以减少使用贝叶斯推理产生决策的冗余操作,提高行为决策的效率;若该 RoboSim 模型未通过安全验证,则回溯修改贝叶斯网络参数,以优

    16、化决策模型.综上,本文主要工作包括以下 3 部分内容.(1)提出一种面向 ADS 行为决策的贝叶斯网络模型,利用领域本体以及他车意图预测 LSTM 模型为构建贝叶斯网络提供驾驶场景信息,通过贝叶斯网络推理特定场景的自动驾驶行为决策.(2)构建 RoboSim 模型承载行为决策的动态执行,以减少贝叶斯网络推理的冗余操作,提高了决策生成的效率.(3)基于模型检测工具 UPPAAL 验证分析 RoboSim 模型的安全性,为自动驾驶提供安全可靠的决策依据.本文第 1 节介绍基于贝叶斯网络构建 RoboSim 模型的自动驾驶行为决策方法的总体框架.第 2 节阐述了ADS 领域本体和他车意图预测 LST

    17、M 模型为贝叶斯网络构建提供的驾驶场景理解信息,以及面向 ADS 行为决策的贝叶斯网络的构建和推理过程.第 3 节介绍如何基于贝叶斯网络生成的决策信息以及驾驶场景信息构建面向 ADS陈洁娜等:基于贝叶斯网络构建 RoboSim 模型的自动驾驶行为决策3837行为决策的 RoboSim 模型,并对其进行验证分析.第 4 节通过变道超车这一自动驾驶典型场景对上述方法进行案例分析,说明本文方法的可行性.第 5 节对相关工作进行对比、分析.最后,总结全文的主要工作并对后续工作扩展进行了讨论.1 总体框架根据目前自动驾驶行为决策所存在的问题,本文提出了一种基于贝叶斯网络构建 RoboSim 模型的自动驾

    18、驶行为决策方法.该方法的核心思想是利用 ADS 领域本体模型和他车意图预测 LSTM 模型,为构建面向 ADS 行为决策的贝叶斯网络提供场景理解信息.然后,利用贝叶斯网络推理得到的决策信息、车辆状态信息和环境信息构建面向 ADS 行为决策的 RoboSim 模型.最后,借助模型转换技术生成 UPPAAL 支持的 NTA 模型并对其进行形式化验证分析.本文的总体框架如图 1 所示.自动驾驶领域本体车辆状态其他车辆环境因素其他行人速度天气红绿灯 交警命令 障碍物 道路条件方向 意图速度行为决策他车意图预测LSTM 模型他车意图预测结果X1LSTMLSTMLSTMFCFCFCX2Xseq_lengt

    19、hy1y2yseq_length方向控制速度控制确定网络参数及结构输入车辆初始状态&环境因素基于 RoboSim 的自动驾驶行为决策模型基于 UPPAAL 的自动驾驶行为决策模型验证及分析TCTL 性质UPPAALSafetyLivenessReachability验证Condition:车辆初始状态环境因素Action:贝叶斯网络决策Condition:环境因素Action:贝叶斯网络决策ifConflict()=trueifConflict()=falseend_S_num=1=S_numcycle=periodend_S_num+1S_numregisterWrite!registerR

    20、ead_OverTakingModule_ClregisterWrite_C_OverTackingModule?end?end?walt_p!GiveOutput()end_S_num+=1cycle=0Init0,TakeInput(l)m3m2Endm1m0cycle=periodi:int0,1COutput_Conflict车辆状态模型转换时间自动机网络s2车辆状态s1execexec基于贝叶斯网络的自动驾驶行为决策行为决策节点不满足优化决策车辆状态节点环境因素节点方向 意图速度方向与其他车辆的车距与其他行人的车距图1基于贝叶斯网络构建 RoboSim 模型的自动驾驶行为决策方法框架

    21、(1)面向 ADS 行为决策的贝叶斯网络本文根据道路车辆预期功能安全标准 ISO2144810,在考虑驾驶场景的层次性与关联性的基础上,分析驾驶3838软件学报2023 年第 34 卷第 8 期场景中的各个元素之间的语义关系,以构建 ADS 领域本体.本文将自动驾驶场景因素分为 3 类,即车辆状态、环境因素和行为决策.在此基础之上,训练他车意图预测 LSTM 模型,以车辆历史轨迹数据作为输入,车辆意图的分类结果作为输出.然后,根据本体模型为贝叶斯网络提供驾驶场景领域知识,为不同的场景选择合适的变量作为贝叶斯网络的节点;同时,将 LSTM 模型的预测结果作为贝叶斯网络中“其他车辆意图”节点的概率

    22、,基于驾驶经验与专家领域知识确定网络结构,通过仿真数据确定条件概率表(conditionalprobabilitytable,CPT).最终,生成面向ADS 行为决策的贝叶斯网络,该网络支持通过最大后验概率推理得到当前驾驶场景下的驾驶行为决策.(2)面向 ADS 行为决策的 RoboSim 模型构建及验证结合仿真数据和已生成的贝叶斯网络,通过抽象状态和迁移,以车辆状态作为状态节点,环境作为边上的迁移条件,贝叶斯网络在该场景下推理得到的最优决策作为边上的迁移动作,可以得到面向 ADS 行为决策的 RoboSim模型.基于本课题组前期的工作,将 RoboSim 模型转换为 NTA 模型,使用 UP

    23、PAAL 对模型进行安全性验证分析,保证了该行为决策模型的安全性.若未通过验证,说明决策模型存在问题,需要回溯优化贝叶斯网络,进而更新 RoboSim决策模型.基于贝叶斯网络构建 RoboSim 模型的自动驾驶行为决策方法可以为自动驾驶提供准确、安全、高效的行为决策.本文将重点讨论如何利用领域本体和 LSTM 来构建面向 ADS 行为决策的贝叶斯网络,以及如何进一步生成面向 ADS 行为决策的 RoboSim 模型并对其进行验证分析.2 面向 ADS 行为决策的贝叶斯网络自动驾驶车辆在进行决策的过程中,首先需要对驾驶环境有深层次的理解,不断对驾驶环境中的变化进行估计、判断和预测,再利用场景信息

    24、得到当前驾驶场景下的决策动作.贝叶斯网络是一种结构灵活的概率图模型11,它的边表示变量之间的依赖关系,用概率分布表示依赖关系的强弱,从而将先验信息或领域知识与数据样本有机结合起来.此外,贝叶斯网络能够结合来自不同来源的本地信息,从而在不确定性的环境下做出决策.因此,本文通过 ADS 领域本体为贝叶斯网络提供驾驶场景因素之间的语义关系,为不同的场景选择合适的变量作为贝叶斯网络的节点并确定网络结构;同时利用 LSTM 对他车意图预测,得到的预测结果作为贝叶斯网络中“其他车辆意图”节点的概率;然后通过仿真数据确定条件概率表(CPT);最后,通过贝叶斯概率推理得到当前驾驶场景下自动驾驶车辆的驾驶行为决

    25、策.2.1 构建面向 ADS 行为决策的贝叶斯网络本节将分别介绍 ADS 领域本体和基于 LSTM 的他车意图预测模型,并在此基础之上构建面向ADS 行为决策的贝叶斯网络模型.2.1.1ADS 领域本体本体是对客观事物的系统化描述,能够表达特定领域中概念之间的语义关系.ADS 领域本体可以对驾驶场景中的各个元素及其关系进行语义描述,从而系统地指导贝叶斯网络节点选择以及节点之间的依赖关系构建,更好地把驾驶信息融入基于贝叶斯网络的行为决策算法中.本文基于道路车辆预期功能安全标准 ISO21448,在考虑驾驶场景的层次性与关联性的基础上,提取驾驶场景中的道路结构、交通标识和交通参与者等信息,将与决策

    26、相关的内容分为了以下 3 类:自身车辆类、行为类、环境类,并为其定义相应的数据属性、对象属性,得到面向 ADS 领域本体模型.本体类的层次关系如下.(1)自身车辆类(ego):描述了 ego 车辆自身的状况,如当前车辆的速度、加速度、与障碍物之间的相对距离、当前所处车道以及车辆行驶方向.(2)行为类(behavior):行为类可以分为纵向行为与横向行为,其中纵向行为包括加速、减速、匀速行驶,横向行为包括向左转、右转、与保持当前车道.(3)环境类(environment):表示自动驾驶车辆中的环境因素,主要由障碍物、天气、路网结构组成.其中障碍物分为行人(pedestrain)、车辆(vehic

    27、le),车辆描述其他车辆的驾驶状态,包括其他车辆的速度、加速度、与 ego陈洁娜等:基于贝叶斯网络构建 RoboSim 模型的自动驾驶行为决策3839车辆的相对距离和方向、与当前车道之间的角度等.天气描述当前的天气状况,主要包括晴天、雨天、雾天和多云等.路网结构表示自动驾驶车辆行驶道路的状况.包括路口、车道、车道线、人行横道、路面标记、交通灯和交通标志等.在给出类的定义之后,所描述的对象的属性和于其他对象的关系需要分别用数据属性和关系属性进行表达.表 1 给出了自动驾驶场景中的部分关系属性与数据属性,其中关系属性的定义域和值域都是类,数据属性的定义域为类,值域为数据类型.如自动驾驶车辆 ego

    28、 具有横向驾驶行为与纵向驾驶行为,故具有关系属性 decision,其定义域为 ego,值域为 behavior;数据属性有 currentVelocity,其定义域为 ego,值域为 double.表1自动驾驶领域本体部分关系属性和数据属性属性种类属性名称定义域值域关系属性decisionegobehaviorcurrentLaneegolanehasFrontObstacleegovehiclehasLeftLanelanelanehasTrafficLightRoadPartTrafficLight数据属性currentVolecityegodoublecurrentDirectione

    29、godoubleObsIntensionObstaclestringObsVelocityObstacledoubleADS 领域本体模型实现了对驾驶场景中类的状态和语义关系的系统性描述,充分表达了驾驶场景中多元异构以及参与者之间的时空交互信息,为后续贝叶斯网络根据驾驶场景信息得到最佳决策动作提供了场景理解信息.2.1.2基于 LSTM 的他车意图预测模型自动驾驶场景中,ADS 行为决策系统需要处理许多难以避免的不确定性因素,其中最重要的因素之一就是周围车辆未来的运动状态的随机性.目前,车载传感器只能对自动驾驶车辆周边的交通参与者进行状态监测,但无法对其未来的运动状态进行预测.由于车辆历史轨迹

    30、数据是时间序列信息,而 LSTM 模型对时序数据具有强大的信息挖掘能力与深度表征能力,并引入“门”机制保存信息,能有效处理长序列,因此,本文基于 LSTM 模型对自动驾驶车辆周围车辆进行意图预测.模型框架如图 2 所示.该模型主要由 3 个部分组成.X1X2X3Xseq_lengthy1y2y3yseq_lengthLSTMLSTMLSTMLSTMFCFCFCFC他车意图预测结果输出层全连接层输入层LSTM 层图2基于 LSTM 的他车意图预测模型Xt(1)输入层:为每个时间步长目标车辆的历史轨迹信息,用特征向量表示.XtXt1ht(2)LSTM 层:在每一个时刻 t,LSTM 单元体接收此刻

    31、的输入和上一个时刻历史轨迹信息的隐藏状态,以更新当前的历史轨迹信息的隐藏状态.yseq_length=(y1,y2,y3)y1,y2,y3(3)全连接层:接收 LSTM 层的输出并对其做分类,将最后一个节点作为分类输出结果,分别表示左转、右转、执行的概率,并将其作为贝叶斯网络节点车辆意图的参数.2.1.3基于 ADS 领域本体和 LSTM 模型构建贝叶斯网络在 ADS 领域本体知识的指导下,自动驾驶中的多元异构信息及其层次关系能够被充分反映在贝叶斯决策网3840软件学报2023 年第 34 卷第 8 期B=G=络中;而基于 LSTM 的他车意图预测模型为贝叶斯决策网络提供了场景中的车辆意图的不

    32、确定性信息,两者结合能够有效构建 ADS 行为决策贝叶斯网络.贝叶斯网络可以用一个二元组来表示,其中为一个有向无环图,N 为节点集合,E 为边的集合,代表两个节点之间有直接依赖关系.因此,贝叶斯网络的构建主要分为两步.(1)确定节点及节点之间的依赖关系:基于本体中类的分层结构,本文将贝叶斯的节点分为 3 类并为其设计分层结构,分别为车辆状态节点、环境因素节点、行为决策节点,其中在环境因素节点内添加了关于车辆意图预测节点,以 LSTM 他车意图预测模型得到的分类结果作为意图预测节点上的概率分布,并基于驾驶经验与专家领域知识确定网络结构.(2)参数学习:即确定各个节点的 CPT.在数据集完整时,贝

    33、叶斯网络参数学习的主要方法为最大似然估计方法和贝叶斯方法.在具体实现中,本文选择了 GeNle12工具作为可视化构建贝叶斯网络的工具并进行参数学习.2.2 基于贝叶斯网络的行为决策推理在确定贝叶斯网络结构以及参数后,下一步的工作就是进行概率推理.贝叶斯网络推理是指利用确定的贝叶斯网络结构以及节点的 CPT,输入当前驾驶环境的实时信息计算决策节点的后验概率.X=xiP(xi|)=(xi)(xi)xiP(xi|)=1,(xi)(xi)在计算最大后验概率的过程中,设影响某节点 X 的节点集合为,则的后验概率可以表示为:,其中 为归一项,保证表示沿着有向边由 X 的父节点传送给 X 的消息,表示由X

    34、沿着有向边的反方向传递给其他节点的消息.算法 1 给出了实现贝叶斯概率推理的伪代码,第 4 行与第 5 行将车辆以及环境相关的信息输入对应的贝叶斯节点中,第 6 行根据车辆与环境信息计算决策节点的最大后验概率,第 7 行将取值最大的值作为当前环境下采取的横向驾驶动作与纵向驾驶动作.实现贝叶斯推理决策的具体效果,本文将在第 4.2 节展开具体描述.算法 1.面向 ADS 的贝叶斯网络行为决策推理算法.输入:自动驾驶仿真数据集 DataSet,已知结构和参数的贝叶斯网络 Bayesian,LSTM 预测结果 LSTM_output;输出:决策节点置信度.1.begin2.for alldataDa

    35、taSet do:3./将与 ego 车相关的信息离散化并输入到车辆状态节点4.ego_data=Discretize(data.ego);5./将与环境相关的信息以及 LSTM 预测结果输入到对应的环境状态节点6.environment_data=Discretize(data.env,LSTM_output);7./车辆状态节点与环境状态节点向其子孙节点传递消息,并计算决策节点的最大后验概率8.Decision(t)=Propagate(ego_data,environment_data);9./将最大后验概率对应的决策状态作为当前环境下采取的横向驾驶动作与纵向驾驶动作10.Set_Max

    36、imum(Decision(t);11.end for12.end 3 基于贝叶斯网络的 RoboSim 模型构建及验证若直接通过训练好的贝叶斯网络对自动驾驶行为进行概率推理做出决策,不考虑缓存相似场景的行为决策,会产生一系列冗余计算,导致计算效率下降.基于此,本节讨论如何构建面向 ADS 行为决策的 RoboSim 模型,以承载贝叶斯网络行为决策的动态执行,具体地,以其内部的状态机作为行为决策的载体,抽象出面向特定场景的车陈洁娜等:基于贝叶斯网络构建 RoboSim 模型的自动驾驶行为决策3841辆状态、环境约束及行为决策动作,从而大幅减少决策过程中的冗余操作,提高计算效率.作为平台无关的仿

    37、真建模语言,RoboSim 可以很好地捕捉仿真执行中的周期语义,且其支持多种形式化验证技术对模型的安全性进行验证分析,包括支持 CSP 验证的 FDR13,概率模型验证工具 PRISM14,以及实时系统验证工具 UPPAAL 等.此外,RoboSim 的支撑工具 RoboTool15实现了其元模型设计、图形化和文本化建模、形式化模型转换等功能,为模型的构建及验证提供了有效的技术支持.其中,将 RoboSim 模型自动转换为 NTA 模型,结合规约语言时间计算树逻辑(timedcomputationtreelogic,TCTL)16,并利用 UPPAAL 工具对其进行形式化验证分析为本团队的前期

    38、工作积累8.因此,本文选择使用 UPPAAL 工具对生成的 RoboSim 模型进行验证分析,以确保生成决策的安全性.3.1 机器人仿真建模语言 RoboSimRoboSim 是一个平台无关的机器人仿真建模语言,拥有结构良好的图形化和文本化语法,并支持多种形式化验证技术.基于仿真建模的特性,RoboSim 融入了仿真执行周期的概念.一个仿真执行周期可表示为寄存器读、执行、寄存器写 3 个操作.因此,RoboSim 模型不仅可以用于机器人仿真,也能用于自动驾驶仿真.由于仿真数据为指定采样周期的离散数据,本文把数据的采样周期抽象为一个 RoboSim 的仿真执行周期,具体表现为:寄存器读用于读取车

    39、辆初始状态和当前环境参数,寄存器写用于根据当前环境信息输出车辆行为决策,以让车辆的物理执行器进一步执行.基于 RoboSim 的周期执行过程如图 3 所示.While(true)寄存器读(车辆初始状态+环境参数)寄存器写(车辆行为决策)等待一个执行周期(采样周期)执行图3RoboSim 的周期执行过程(module,Interface)一个 RoboSim 模型可定义为一个二元组,其中:module(cycle,platform,Controller)cycleplatformControllercontroller:表示一个模块,用于指定执行周期、物理平台的接口以及并行运行的控制器,它可以表

    40、示为一个三元组.其中,表示仿真执行周期;表示物理平台提供或定义的接口,以接收外部环境参数和发送内部控制信息;表示并行运行的控制器集合,每个控制器由一个或多个状态机(statemachine)组成,每个状态机类似 UML 中的状态机模型,用于建模内部控制逻辑,包含了状态机体(statemachinebody)和输入输出接口等,状态机体用于表示状态的迁移.Interface:表示接口的集合,接口中声明了操作和事件,操作代表物理平台提供的服务,并由控制器和状态机获取;事件用于各个组件之间的交互.相比于传统的UML状态机模型,采用 RoboSim 模型除了可以很好地模拟自动驾驶车辆的执行周期,还能够方

    41、便地转换至其他仿真或验证平台进行仿真及验证分析,为抽象自动驾驶行为决策模型提供了较好的载体.3.2 构建面向 ADS 行为决策的 RoboSim 模型根据上一节针对 RoboSim 模型的定义,一个完整的面向 ADS 行为决策的 RoboSim 模型包括模块、接口、控制器、状态机等.除状态机中的状态机体外,其余组件的构建与自动驾驶行为决策的关联性不大,故本文不作赘述.下面将重点介绍如何构建 RoboSim 模型中的状态机体,以承载由车辆状态信息、环境信息及贝叶斯网络推理得到的决策信息.(State,Transition)一个 RoboSim 状态机体可定义为,分别表示状态和迁移的集合.其中,单

    42、个状态和单条迁移定义如下.state:唯一标识了当前车辆的状态信息 ego_state,包括车辆当前运行速度、转向角度、车道信息、与其他车辆的相对距离信息等;transition(source,target,condition,action)sourcetarget:由元组组成.其中和为迁移的起始和终止状态;3842软件学报2023 年第 34 卷第 8 期conditionaction$decision(acc,angle)accangleexec标识了当前的环境信息,需要扩展为以/(合取)连接的表达式,并通过提供接口由上层组件输入;标识了当前的行为决策信息,并通过定义接口传递给上层组件.决

    43、策信息表示为表达式,其中$指操作不立即通过接口传递,而是等到周期结束时传递,和分别用具体的决策值替换.此外,该状态机体在每一个决策动作结束后,通过 RoboSim 中的特殊事件标识当前执行周期的结束和下一执行周期的开始.算法 2 给出了 RoboSim模型中状态机体的状态及迁移关系生成的伪代码,以自动驾驶仿真数据集和训练好的面向 ADS 决策的贝叶斯网络为输入,输出 RoboSim 模型的状态机体中包含的状态及迁移关系.算法的执行大致流程为:遍历仿真数据集中的每一条数据,根据贝叶斯网络推理得到的决策信息以及环境信息和车辆的当前状态信息,计算车辆下一时刻的状态,并将新的状态信息存入状态集合中,同

    44、时构建迁移边,并将新的迁移边信息存入迁移集合中.算法中还加入了为贝叶斯网络优化方法所保留的接口,以保证通过 RoboSim 模型所做的决策不会导致车辆进入不安全状态,即当识别到车辆的下一个状态 next_state 为不安全状态时,会调用该优化方法调整贝叶斯网络,并重做当前决策,直到下一个状态安全为止.该回溯优化将作为下一阶段的工作重点进行探讨,本文不予讨论.算法 2.RoboSim 状态机体的状态及迁移生成算法.输入:数据集 DateSet,训练好的贝叶斯网络 Bayesian;输出:状态集合 State,迁移条件集合 Transition.1.begin2.createaninitialj

    45、unctioninit;3.createasetState;/状态集合,用于存储 RoboSim 状态机体中的状态4.createasetTransition;/迁移边集合,用于存储 RoboSim 状态机中的迁移5.createastatenext_state;/用于记录下一个状态的状态信息6.forall dataDataSetdo:7.ifdataisinitialdatathen/如果为场景的初始状态8.state=data.ego_state;/则将数据集中的车辆状态信息作为当前状态9.ifnotState.has(state)then10.State.add(state);11.e

    46、nd if12.ifTransition.has(init,state,null,null)then13.Transition.add(init,state,null,null);14.end if15.else16.state=next_state;/保存由上一个循环计算出的下一个状态;17.end if18.decision=Bayesian(state,data.env);/利用贝叶斯网络根据当前车辆状态信息和环境信息推理出决策19.next_state=count(state,decision);/根据决策计算出下一个状态20.ifnotState.has(next_state)the

    47、n21.ifnext_stateisnotasafestatethen22./若进入不安全状态,回溯优化贝叶斯网络23.BacktrackingandoptimizingtheBayesiannetwork;24.else25.State.add(next_state);26.end if陈洁娜等:基于贝叶斯网络构建 RoboSim 模型的自动驾驶行为决策384327.end if28.ifnotTransition.has(state,next_state,env,decision)then29.Transition.add(state,next_state,data.env,decisio

    48、n);30.end if31.end for32.end 3.3 基于 UPPAAL 的 RoboSim 模型验证及分析UPPAAL 是一种支持实时系统建模及验证的模型检测工具,其输入模型为 NTA 模型,并使用 TCTL 进行性质规约.通过已实现的模型转换技术,可以直接将生成的面向 ADS 行为决策的 RoboSim 模型转换为 UPPAAL 支持的 NTA 模型.该 NTA 包含了表示 RoboSim 模型中模块、控制器和状态机 3 个组件执行周期的时间自动机(timedautomota,TA)模型,由状态机体转换生成的 TA 模型以及相应的变量和通道声明.其中,$decision(acc

    49、,angle)作为一个函数被写进全局声明中.此外,通过模型转换方法,还能自动生成一些待验证的 TCTL 性质规约,包括无死锁性,无输出冲突和所有状态的可达性.最后,使用 UPPAAL 工具对模型进行形式化验证分析,以确保所建立的面向 ADS 行为决策 RoboSim 模型的安全性.4 案例分析本节以变道超车场景为例,讨论如何基于贝叶斯网络和 RoboSim 模型进行自动驾驶行为决策.首先,在 ADS领域本体的指导下,以贝叶斯网络建模工具 GeNl 作为可视化载体构建贝叶斯网络,通过自动驾驶仿真模拟器CARLA(centerforadvancedresearchonlanguageacquisi

    50、tion)17生成的仿真数据对贝叶斯网络进行参数学习,并进一步生成面向 ADS 行为决策的 RoboSim 模型,最后对其进行形式化验证分析.实验部分代码详见 https:/ 变道超车场景由于本文方法需尽可能考虑到环境中的不确定性因素,如天气、周围车辆信息等.近年来虚拟仿真技术的发展可以实现真实场景的逼真模拟.使用 CARLA 仿真器生成自动驾驶数据集,包括自动驾驶车辆的位置信息、速度信息以及车道信息等,并可定制行人、其他车辆和天气等环境因素信息.CARLA 生成的变道超车场景如图 4所示.veh_f1veh_eveh_f0veh_b1lane1lane0图4变道超车场景图 4 中场景主要包含


    注意事项

    本文(基于贝叶斯网络构建RoboSim模型的自动驾驶行为决策.pdf)为本站上传会员【自信****多点】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4008-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表




    页脚通栏广告
    关于我们 - 网站声明 - 诚招英才 - 文档分销 - 便捷服务 - 联系我们 - 成长足迹

    Copyright ©2010-2024   All Rights Reserved  宁波自信网络信息技术有限公司 版权所有   |  客服电话:4008-655-100    投诉/维权电话:4009-655-100   

    违法和不良信息举报邮箱:help@zixin.com.cn    文档合作和网站合作邮箱:fuwu@zixin.com.cn    意见反馈和侵权处理邮箱:1219186828@qq.com   | 证照中心

    12321jubao.png12321网络举报中心 电话:010-12321  jubao.png中国互联网举报中心 电话:12377   gongan.png浙公网安备33021202000488号  icp.png浙ICP备2021020529号-1 浙B2-20240490   



    关注我们 :gzh.png  weibo.png  LOFTER.png