无人驾驶系统中复杂动态立项建设环境下显著性目标的识别学士学位论文.doc
《无人驾驶系统中复杂动态立项建设环境下显著性目标的识别学士学位论文.doc》由会员分享,可在线阅读,更多相关《无人驾驶系统中复杂动态立项建设环境下显著性目标的识别学士学位论文.doc(27页珍藏版)》请在咨信网上搜索。
1、毕业设计题 目 无人驾驶系统中复杂动态 环境下显著性目标的识别 学 院 机械工程学院 专 业 机械工程及其自动化 班 级 学 生 学 号 指导教师 二一一年五月三十日济南大学毕业设计1 前 言1.1 背景机动车辆作为社会发展与科技进步的产物,为人类的文明进步和社会经济的发展做出了不可磨灭的贡献。然而,汽车在给人类带来方便生活的同时,也给人们带来了大量的问题,例如交通安全、经常性的交通拥挤和环境污染问题等。交通事故给国家和人民的生命财产带来了巨大损失。根据统计资料表明,全世界道路交通事故的总数大约占安全事故的90%左右,所造成的伤亡人数占所有安全事故伤亡人数的80%以上。在人类的非正常死亡之中,
2、道路交通事故作为“第一杀手”实至名归。为了解决全球社会共同面临的交通问题,美国、欧洲、日本等发达国家已经逐步采用高新技术改造现有的道路交通系统和管理体系以替代传统的修建更多的道路、扩展路网规模,并投入了大量的人力和物力以开展智能交通系统的研究。交通标志识别系统作为无人驾驶系统的一个非常重要的子系统,也是难点之一,对其深入研究有助于提高机动车驾驶的安全性和舒适性,对智能交通系统和智能车的研究具有重要意义。另外,自然场景下的交通标志识别也是基于视觉的目标识别的一个特例,交通标志的识别技术可自然地推广到军用或民用的无人驾驶车的研究中,因而,对其深入研究也具有重要的价值。无人驾驶系统中复杂动态环境下显
3、著性目标的识别主要是研究交通标志识别,交通标志识别是通过安装在车辆上的摄像机或照相机录取或摄取户外自然场景图像,然后经过相应的的检测与分类算法对其进行分类理解和分析,它比一般的简单的目标识别更具挑战性,原因在于自然场景中存在各种各样的因素会影响到交通标志的检测效果和分类精度。1.2 国内外研究现状目前,国内虽然在智能交通系统和高级辅助驾驶系统方面作了初步的研究,也取得了一些成绩和进步。但是,由于我国在智能交通系统和智能汽车方面的研究起步比外国晚了几十年,研究的深度和广度远远不及国外发达国家的水平。1.2.1交通标志检测算法的研究现状交通标志由特定的颜色、形状以及内部图形组成,因而,大部分交通标
4、志检测算法一般都是基于颜色和形状的信息来检测交通标志。接下来对这两类检测算方法分别进行阐述。(1)基于颜色信息的检测算法:颜色作为交通标志的主要特征之一,有很多算法都是具有大小、视角不变性和可分离性的特点。通过对特征颜色进行分割,可以删除大片非显著区域,大大增强了系统的实时性。根据检测算法所采用的彩色空间,基于颜色的检测算法又可分为以下四类:RGB彩色空间的阈值分割算法、HIS彩色空间的阈值分割算法、 HSV彩色空间的阈值分割算法和CIE彩色空间的阈值分割算法20。(2)基于形状特征的检测算法:尽管颜色信息具有大小和视角不变性和较强的可分离性,但是由于多变的自然环境的和天气的变化莫测,导致交通
5、标志的颜色信息不稳定强度增加,给基于颜色的标志检测增加了很大的困难20。因此基于交通标志几何形状的特征一般不受光照影响特点,许多学者参与研究了基于几何形状的检测算法。1.2.2交通标志分类算法的研究现状交通标志的分类理解和识别是交通标志识别问题的最终目标。目前,世界上已有很多的交通标志分类算法,大致可分为统计分类方法、神经网络分类方法、句法存分类和集成分类方法等20。1.3课题学术和使用意义在学术方面,通过对这种显著性目标识别算法的研究,使用实时录像和识别作为智能车辆系统的信息获取手段,再结合交通和计算规则的决策和智能自动控制技术等多种先进技术的综合应用,对于无人驾驶系统的研究有着探索性的意义
6、。无人驾驶系统所涉及到的其他技术包括图像处理、数据融合等多方面,是一项综合性极高的工程。人类的视觉具有选择性注意的特性,我们能够从复杂、未知场景中不受复杂背景影响而快速准确地检测到我们所需要的显著目标。但在机器视觉技术和自动目标识别等领域,基于视觉注意显著图的生成方式到目前为止还没有形成统一模型。同时由于显著区域的检测在自适应压缩,图像检索和目标检测等领域中有着广泛的应用价值,因此,显著目标区域检测得到国内外众多学者的广泛和深切关注。目前打多数人所使用的显著目标提取算法都是从低级视觉出发的,这是因为高级视觉计算模型需要学习大规模的和图像数据库有关的理论和知识,计算量大而且不具有通用性。目前现有
7、的而且受大家欢迎的低级视觉模型主要依赖像素与像素之间的相互对比,因而缺乏利用显著目标的自身所具有的特征进行分析理解。因此,本论文依据显著目标是紧凑、显眼和完整的思路,提出一种基于局部复杂度和目标空间分布特性的自动视觉注意显著目标自动提取算法。首先根据局部区域与其多个尺度的邻域的对比,得到亮度显著图;然后利用颜色信息的显眼性的特征、空间分布的方式和区域一致性的特点得到颜色显著图;同时通过对方向的空间分布方法和局部的复杂度进行多个尺度分析得到方向显著图。最后通过所得显著值的空间分布和面积增强因子相结合的融合策略得到原始图像的显著图,并且根据显著区域确定感兴趣区域所在的位置,在此基础上完成目标的检测
8、,来克服传统方法的缺陷,以得到更加合理有效的显著图13。2 显著性目标识别系统2.1 显著性目标识别系统的开发环境由于显著性目标识别系统对图形操作的需要和系统运算及处理的实时性要求,我们选用Microsoft Visual 2010.NET的C+作为开发的语言环境。同时,强大的消息处理机制和灵活的内存操作使得系统响应实时性更好,有利于提高处理图像的质量和显示速度,为我们开发更加优质的目标识别系统打下了良好的基础。本目标识别系统采用面向对象的程序设计方法,面向对象的程序设计语言将现实世界中的客观事物描述成具有属性和行为的对象,通过抽象找出同一类对象的共同属性(静态属性)和行为(动态特征),形成类
9、15。类与外界进行交流是通过一个简单的外部接口实现的,对象与对象之间通过消息映射机制来进行通讯。这使程序模块与模块之间的关系更为简单,同时,也良好的保障了为程序模块的独立性、数据的安全性。类的继承性与多态性是面向对象设计方法的最大特点,这不仅大大提高了程序的可重用性,可以让程序员很方便地实现代码的重用,而且缩短了软件开发周期、减少了开发费用并使风格统一起来,显得更加美观。因此,面向对象的编程语言使程序能够比较直接反映问题域的本来面目,软件开发人员能够利用人类认识事物所采用的一般思维方法来进行软件开发。C+面向对象设计有三个优点,如下所示,(1)封装性这里所说的封装,就是把数据和函数有机地联系在
10、一起形成一个具有同类特的特性的对象15。封装好的对象应具有明确的功能和方便的接口,以便其他类引用。另外,封装的对象也有priviate,即封装内部的数据应该受到类保护,防止被外界分子不合法的获取或更改。(2)继承性根据c+语言,类可以派生,从类派生出的类称为子类,而原来的类称为父类。在类的派生中,子类可以具备父类的全部数据、成员变量及成员函数,这个特征称为类的继承15。在子类中,不但可以继承父类的的变量和函数,它也可以增加属于自己新的数据或新的操作,用来完成新的功能。(3)多态性多态性是c+针对面向对象的特征进行程序设计的一种特征。C+允许建立程序具有相同成员函数名的对象15。这些函数在不同的
11、情况下适用的不同的功能。举个非常的简单例子,要在一些整数中找到其中的最大值,但是不明确整数的个数,只能知道范围是2个、3个或4个。2.2 显著性目标识别系统的组成显著性目标系统的工作原理流程图如图2.1所示,首先根据局部区域与其多个邻近尺度领域的对比得到亮度显著图;然后利用颜色信息的空间紧凑性、孤立性和同质性得到颜色显著图;同时通过局部复杂度进行多尺度和对方向的空间分布的分析得到方向显著图13。最后通过特征图融合策略得到原始图像的显著图,并根据显著图确定显著感兴区域,提取显著目标。输入图像局部与其多尺度邻域对比显著检测模型亮度显著图方向显著图颜色空间紧性、同质性、孤立显著检测模型方向空间分与局
12、部复杂度显著检测模型颜色显著图面积增强因子和空间分布因子的融合策略显著图显著性目标原始的图像图2.1显著目标提取流程图2.3显著性目标识别系统的开发平台我们以微软的Visual Studio 2010 C+.NET为开发语言,使用Cximage和DirectShow软件开发包作为图形引擎,构成软件的开发平台,如图2.2所示。CxImage是一个非常著名的可以用于MFC 的C+图像处理类库类,它可以打开,保存,显示,转换如BMP, JPEG, GIF, PNG, TIFF, MNG, ICO 等各种格式的图像文件。该开发包向外完全开放源代码,图像被封装为一个类,它的功能很强大,与Windows、
13、MFC等系统支持极好,支持图像的线性滤波、直方图操作、中值滤波、旋转缩放、阈值处理、区域选取、膨胀腐蚀、alpha混合等各种操作。另外,它还支持从文件、内存或者win32API定义的位图图像格式中读取图像,支持将图像显示在任意窗口。DirectShow是微软公司在ActiveMovie和Video for Windows的基础上与DirectX开发包一起推出与发布的新一代基于COM(Component Object Model)的流媒体处理的开发包。DirectShow使用一种叫Filter Graph的模型来管理整个数据流的处理过程,运用DirectShow,我们可以很方便地从支持WDM驱动
14、模型的采集卡上捕获数据,并且进行相应的后期处理乃至存储到文件中。这样使在多媒体数据库管理系统(MDBMS)中多媒体数据的存取变得更加方便。它广泛地支持各种媒体格式,包括Asf、Mp3、Mpeg、Wave等,为多媒体流的捕捉和回放提供了强有力的支持。图2.2 显著性目标识别系统的开发平台3 开发平台的基本功能3.1 图像提取在Cximage 类库和DirectShow的基础上实现图像的提取。根据DirectShow提供的照相功能,利用Cximage类库提供的函数,编写程序代码,以实现图像的提取。程序代码如下:void CVidCapDlg:OnBnClickedTestGetimage() SY
15、STEMTIME SystemTime; GetLocalTime(&SystemTime); TRACE(L %d:%d:%dn, SystemTime.wHour, SystemTime.wMinute, SystemTime.wSecond); unsigned char* pData = sgGrabData(); if (pData != 0) DrawData(sgGetBitmap();extern unsigned int gWidth,gHeight;if(image) image-Destroy(); delete image; image=NULL;image = new
16、 CxImage;image-CreateFromArray(pData,gWidth,gHeight,24,3*gWidth,true);ReDraw(); 这是实现图像提取功能的程序模块。首先对要用到的类和变量进行声明,SystemTime被声明为以已经定义好的SYSTEMTIME结构体,它的的功能是引用系统的具体时间。GetLocalTime(&SystemTime)具体执行获取本地时间。TRACE通过检测可以监视以真实设置运行的应用程序的状态并且跟踪则可以帮助您在不干扰系统运行的情况下隔离并修复问题。pData被声明为一个字符指针,并被赋予一个初值,该初值是抓取的初始界面的数据。然后判
17、断pData是否为真,如果为真,则重新抓取图像。再外部声明gWidth,gHeigh两个全局变量,如果image中的原始图像没有被删除,则删除image的原始图像,并把新产生的图像赋予image图像指针,为使新产生的图像建立调色板,并且取得新建图像的基本数据。这样,图像提取功能的程序模块的编程就完成了。3.2 打开图像在Cximage 类库和DirectShow的基础上实现图像的提取。根据DirectShow提供的照相功能,利用Cximage类库提供的函数,编写程序代码,以实现图像的输入。程序代码如下:void CVidCapDlg:OnBnClickedTestOpen()CFileDial
18、og dlgFile(TRUE);CString fileName; int c_cMaxFiles = 100; int c_cbBuffSize = (c_cMaxFiles * (MAX_PATH + 1) + 1;dlgFile.GetOFN().lpstrFile = fileName.GetBuffer(c_cbBuffSize);dlgFile.GetOFN().nMaxFile = c_cMaxFiles;dlgFile.m_ofn.lpstrTitle = _T(打开图像文件);dlgFile.m_ofn.lpstrFilter =_T(JPG 文件(*.jpg)0*.jpg
19、0BMP 文件 (*.bmp)0*.bmp00);if(dlgFile.DoModal()!=IDOK)fileName.ReleaseBuffer();return;int FileType=CxImage:GetTypeIdFromName(dlgFile.GetFileExt();if(image) image-Destroy(); delete image; image=NULL;image = new CxImage(fileName, FileType);if (!image-IsValid()CString s(image-GetLastError();AfxMessageBox
20、(s);delete image;image = NULL;ReDraw();fileName.ReleaseBuffer();这是实现图像打开功能的程序模块。首先声明了dlgFile是CFileDialog类,可以实现 CFileDialog的功能并令dlgFile的参数为真;fileName是字符类,说明文件的名字是字符类;声明了整型变量c_cMaxFiles,并赋予初值为100;也声明了整型变量c_cbBuffSize,并赋予初值为(c_cMaxFiles * (MAX_PATH + 1) + 1,其中MAX_PATH的值由库函数提供的,为260,MAX_PATH是指一个数组的最大容量。
21、然后获取要打开文件的名字和图像的最大尺寸,将执行打开图像功能的标记和图像文件的名字贮存起来。接着,判断DoModal()是否成功建立向导,如果成功建立向导,IDOK就返回结束或删除的地址。声明整型变量FileType,并将图像文件的格式赋给它。如果image中的原始图像没有被删除,则删除image的原始图像,并把新产生的图像赋予image图像指针,判断图像是否有效,如果图像无效,则将建立一个消息盒子,从而删除此图像,使图像指针image为空。最后重绘图像,并释放缓冲存储器的数据。3.3 保存图像在Cximage 类库和DirectShow的基础上实现图像的提取。根据DirectShow提供的照
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 无人驾驶 系统 复杂 动态 立项 建设 环境 显著 目标 识别 学士学位 论文
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【可****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【可****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。