视频与图像基础.ppt
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 视频 图像 基础
- 资源描述:
-
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,视频与图像基础,多媒体视频,内容提要,视觉系统对颜色的感知,图像的颜色模型,图像的分辨率,图像的象素深度,数字视频基础,运动图象压缩标准,视频编辑软件,流媒体,一、视觉系统对颜色的感知,视觉系统对颜色的感知,人们获取的信息的,70,来自,视觉系统,颜色是视觉系统对可见光的感知结果。可见光是波长在,380nm-780nm,之间的电磁波,我们看到的大多数光不是一种波长的光,而是由,许多不同波长的光组合,成的。,研究表明,人的视网膜有对,红(Red)、绿(Green)、蓝(Blue),颜色敏感程度不同的三种,锥体细胞,,另外还有一种在光功率极端低的条件下才起作用的,杆状细胞,,因此,颜色只存在于眼睛和大脑,。,人的视觉系统对颜色的感知可归纳出如下几个特性:,眼睛本质上是一个照相机,红、绿和蓝三种锥体细胞对不同频率的光的感知程度不同,对不同亮度的感知程度也不同,自然界中的任何一种颜色都可以由R、G、B这3种颜色值之和来确定,色彩三要素,色调:颜色的种类,与颜色明暗无关,亮度:明亮程度,饱和度:彩色光所呈现颜色的深浅或纯洁程度,对同一色调的彩色光,饱和度越高,颜色就越纯,如红白-粉红这个过程中基本色调没有变化,但饱和度降低了,人的眼睛能分辨大约128种色调,510种饱和度,而对亮度非常敏感,可分辨的颜色大约35万种,三基色,基色是指互为独立的单色,任一基色不能由其他基色混合产生,根据人眼对彩色视觉的大量实验,采用红、绿、兰这三种相互独立的基色,按照不同比例组合,可以配出大部分颜色与自然界色彩相符。,互补色:两种颜色混合得白色,则为互补色,二、,图像的颜色模型(RGB模型与CMYK模型),用来确定和生成各种颜色的一套规则和定义,成为颜色模型或色彩模型。,图像的颜色模型,一个能发出光波的物体称为,有源物体,,它的颜色由该物体发出的光波决定,使用,RGB相加混色模型,;,一个不发光波的物体称为,无源物体,,它的颜色由该物体吸收或者反射哪些光波决定,用,CMY相减混色模型,。,1显示彩色图像用RGB相加混色模型,电视机和计算机显示器使用的阴极射线管是一个有源物体。CRT使用3个电子枪分别产生,红(Red)、绿(Green)和蓝(Blue),三种波长的光,并以各种不同的相对强度综合起来产生颜色,彩色显像管产生颜色的原理,从理论上讲,,任何一种颜色都可用三种基本颜色按不同的比例混合得到,。三种颜色的光强越强,到达我们眼睛的光就越多,它们的比例不同,我们看到的颜色也就不同,没有光到达眼睛,就是一片漆黑。当三基色按不同强度相加时,总的光强增强,并可得到任何一种颜色。某一种颜色和这三种颜色之间的关系可用下面的式子来描述:,颜色R(红色的百分比)G(绿色的百分比)B(蓝色的百分比),相加混色,Red(红)+Green(绿)=Yellow(黄),Red(红)+Blue(蓝)=Magenta(品红),Green(绿)+Blue(蓝)=Cyan,(青),一幅彩色图像可以看成由许许多多的点组成的,如图所示。,图像中的单个点称为,像素(pixel),每个像素都有一个值,称为,像素值,,它表示特定颜色的,强度,。,一个像素值往往用,R、G、B三个分量,表示。,如果每个像素的每个颜色分量用二进制的1位来表示,那么每个颜色的分量只有“1”和“0”这两个值。,这也就是说,每种颜色的强度是100%,或者是0%。在这种情况下,每个像素所显示的颜色是8种可能出现的颜色之一。,8色,RGB 颜色,000 黑,001 蓝,010 绿,011 青,RGB 颜色,100 红,101 品红,110 黄,111 白,三、图像的分辨率,三、图像的分辨率,我们经常遇到的分辨率有三种:,显示分辨率,图像分辨率,像素分辨率,。,1 显示分辨率,显示分辨率是指显示屏上能够显示出的像素数目,。,例如,显示分辨率为640480表示显示屏分成480行,每行显示640个像素,整个显示屏就含有307200个显像点。,屏幕能够显示的像素越多,说明显示设备的分辨率越高,显示的图像质量也就越高。,LCD与CRT,电脑显示器包括两种:,液晶显示LCD(liquid crystal display),一般都采用CRT显示,电脑CRT显示器类似于彩色电视机中的CRT。显示屏上的每个彩色象点由代表R、G、B三种模拟信号的相对强度决定,这些彩色象点就构成一幅彩色图像。,2图像分辨率,图像分辨率是指组成一幅图像的像素密度的度量方法,。,对同样大小的一幅图,如果组成该图的图像像素数目越多,则说明图像的分辨率越高,看起来就越逼真。相反,图像显得越粗糙。,在用扫描仪扫描彩色图像时,通常要指定图像的分辨率,用每英寸多少点表示,即DPI(dots per inch)。如果用300DPI来扫描一幅810的彩色图像,就得到一幅24003000个像素的图像。分辨率越高,像素就越多。,图像分辨率与显示分辨率是两个不同的概念。图像分辨率是确定组成一幅图像的像素数目,而显示分辨率是确定显示图像的区域大小。,如果显示屏的分辨率为640480,那么一幅320240的图像只占显示屏的1/4;相反,24003000的图像在这个显示屏上就不能显示一个完整的画面。,像素分辨率,像素分辨率是指显像管荧光屏上一个像素点的宽和长之比,。,例如:在捕捉图像时,如果显像管的象素分辨率为2:1,而产生图像的显像管的象素分辨率为1:1,这时该图像会发生变形。,四、像素深度,象素深度,像素深度是指存储每个像素所用的位数,,它也是用来度量图像的分辨率。(,声音数字化时的采样位数,),像素深度决定彩色图像的每个像素可能有的颜色数,或者确定灰度图像的每个像素可能有的灰度级数。,例如,一幅彩色图像的每个像素用R、G、B三个分量表示,若每个分量用8位,那么一个像素共用24位表示,就说像素的深度为24,每个像素可以是2,24,=16 777 216种颜色中的一种。,在这个意义上,,往往把像素深度说成是图像深度,。表示,一个像素的位数越多,它能表达的颜色数目就越多,而它的深度就越深,。,五、真彩色、伪彩色与直接色,1 真彩色,真彩色是指在组成一幅彩色图像的每个像素值中,有R、G、B三个基色分量,每个基色分量直接决定显示设备的基色强度,这样产生的彩色称为真彩色,。,例如用RGB 555表示的彩色图像,R、G、B各用5位,用R、G、B分量大小的值直接确定三个基色的强度,这样得到的彩色是真实的原图彩色。,如果用RGB 8:8:8方式表示一幅彩色图像,就是R、G、B都用8比特来表示,每个基色分量占一个字节,共3个字节,每个像素的颜色就是由这3个字节中的数值直接决定,可生成的颜色数就是2,24,16 777 216种。,用3个字节表示的真彩色图像所需要的存储空间很大,而人的眼睛是很难分辨出这么多种颜色的,因此在许多场合往往用RGB 5:5:5来表示,每个彩色分量占5个比特,再加1比特显示属性控制位共2个字节,生成的真颜色数目为2,15,=32K。,2 伪彩色,伪彩色图像的含义是,,每个像素的颜色不是由每个基色分量的数值直接决定,而是把像素值当作彩色查找表CLUT(color look-up table)的表项入口地址,去查找一个显示图像时使用的R、G、B强度值,用查找出的R、G、B强度值产生的彩色称为伪彩色,。,彩色查找表CLUT(color look up table)是一个事先做好的表,表项入口地址也称为索引号。例如16种颜色的查找表,0号索引对应黑色,.,15号索引对应白色。彩色图像本身的像素数值和彩色查找表的索引号有一个变换关系。,3 直接色,每个像素值分成R、G、B分量,每个分量作为单独的索引值对它做变换,也就是通过相应的彩色变换表找出基色强度,用变换后得到的R、G、B强度值产生的彩色称为直接色,。,它的特点是,对每个基色进行变换,。,直接色与真彩色、伪彩色的比较,直接色与真彩色相比,,,相同之处,是都采用R、G、B分量决定基色强度,,不同之处,是前者的基色强度直接用R、G、B决定,而后者的基色强度由R、G、B经变换后决定。因而这两种系统产生的颜色就有差别。试验结果表明,使用直接色在显示器上显示的彩色图像看起来真实、很自然。,直接色与伪彩色系统相比,,,相同之处,是都采用查找表,,不同之处,是前者对R、G、B分量分别进行变换,后者是把整个像素当作查找表的索引值进行彩色变换。,六、图形与图像,矢量图与点阵图(位图),在计算机中,表达图像和计算机生成的图形图像有两种常用的方法:一种叫做是,矢量图,(vector based image)法,另一种叫,点阵图,(bit mapped image)法。虽然这两种生成图的方法不同,但在显示器上显示的结果几乎没有什么差别。,图形(矢量图),图形(Graphic)是指从点、线、面到三维空间的黑白或彩色几何图。,图形的格式是一组描述点、线、面等几何图形的大小、形状及其位置、维数的指令集合。,在图形文件中只记录生成图的算法和图上的某些特征点,因此也称矢量图。,图像(位图/点阵图),图像(Image)是由像素点阵组成的画面。,静止的图像是一个矩阵,阵列中的各项数字用来描述构成图像的各个点(称为像素点 pixel)的强度与颜色等信息。这种图像也称为位图(bit-mapped picture)。,图像与图像的比较,位图文件占据的存储器空间比较大。影响点位图文件大小的因素主要有两个:图像分辨率和像素深度。,分辨率越高,就是组成一幅图的像素越多,则图像文件越大;像素深度越深,就是表达单个像素的颜色和亮度的位数越多,图像文件就越大。,而矢量图文件的大小则主要取决于图的复杂程度。,矢量图与位图相比,显示位图文件比显示矢量图文件要快;,矢量图侧重于“绘制”、去创造,而位图偏重于“获取”、去“复制”;,矢量图和位图之间可以用软件进行转换,由矢量图转换成点位图采用,光栅化(rasterizing)技术,,这种转换也相对容易;由点位图转换成矢量图用,跟踪(tracing)技术,,这种技术在理论上说是容易,但在实际中很难实现,对复杂的彩色图像尤其如此。,七 灰度图与彩色图,1 灰度图,灰度图(gray-scale image)按照灰度等级的数目来划分,。,只有黑白两种颜色的图像称为,单色图像(monochrome image),。图中的每个像素的像素值用1比特存储,它的值只有“0”或者“1”,一幅640480的单色图像需要占据37.5 KB的存储空间。,标准单色图和标准灰度图,彩色图像,彩色图像(color image)可按照颜色的数目来划分,例如256色图像和真彩色(2,24,16 777 216种颜色)等。,256色标准图像转换成的256级灰度图像,上图是一幅用256色标准图像转换成的256级灰度图像,彩色图像的每个像素的R、G和B值用一个字节来表示,一幅640480的8比特彩色图像需要307.2 KB的存储空间;,(6404801307200byte),(,这副彩色图像是真彩色还是伪彩色?,),真彩色图像转换成的256级灰度图像,上图是一幅真彩色图像转换成的256级灰度图像,每个像素的R、G、B分量分别用一个字节表示,一幅640480的真彩色图像需要921.6 KB的存储空间。,(6404803921600byte),许多24比特彩色图像是用32比特存储的,这个附加的8比特叫做,alpha通道,,它的值叫做alpha值,它用来表示该像素,如何产生特技效果,。,使用真彩色表示的图像需要很大的存储空间,在网络传输也很费时间。,由于人的视角系统的颜色分辨率不高,因此在没有必要使用真彩色的情况下就尽可能不用,。,数字视频基础,1.什么是视频?,若干有联系的图像数据连续播放便形成了视频。,图像是离散的视频,视频是连续的图像,常见的视频信号是电影和电视,2.模拟视频与数字视频,模拟视频,以模拟电信号的形式来记录、依靠模拟技术在空间传播的视频技术。,数字视频,基于数字技术及其他更为拓展的图象显示标准。两层涵义:模数转换后制成的数字视频产品;数字摄像机拍摄的视频图象。,3.帧和帧速率,视频是由,一系列单独的图象,组成的,帧:一幅幅单独的图像,帧速率:每秒钟连续播放的帧数。典型的为24帧/秒,25帧/秒,30帧/秒,Flash默认为12帧/秒,.,由于视频播放是利用人眼的视觉暂留特性产生运动影像,因此对每秒钟扫描多少帧有一定的要求。PAL制电视系统,帧速率为25帧/s,NTSC制电视系统,帧速率为30帧/s。,根据实验,人眼可觉察到低于1/50s速率刷新的图象中的闪烁,在不增加带宽的情况下,采用了隔行扫描的技术。,当计算机对模拟视频进行数字化时,就必须要在规定时间内(如1/30)完成量化、压缩和存储等多项工作。,4.视频信号的格式,根据亮度/色度原理,将RGB信号分成两个部分:亮度部分Y,它是控制图象亮度的单色视频信号;色度部分,包括图象的着色信号,色度部分实际上是两个色差信号B-Y,R-Y。,由于人眼对图象的色度细节分别能力低,而对亮度细节分别力高,因此可对两个色差信号的频带怪度进行压缩处理,而不回大量损失可视细节。,5.视频制式标准,是指电视显示的标准,常见的三种电视制式,NTSC制式:30帧/秒,525行,宽高比4:3,隔行扫描,场扫描频率60hz,美国、加拿大等大部分西半球国家,以及日韩,菲律宾和中国的台湾地区,PAL制式:25帧/秒,625行,宽高比4:3,隔行扫描,场扫描频率50hz,德国、中国、朝鲜等采用,SECAM制式:同PAL制式,不同的是色度信号是频率调制,法国、前苏联以及东欧国家采用,HDTV:高清晰度电视,标准尚未统一,帧扫描频率1000行以上,宽高比16:9,逐行扫描,传送频率全部数字化。,6.视频的数字化,数字化过程:,扫描,采样,量化,编码,大多数视频处理系统采用YUV分量格式分3路进行数模转换,采样格式,4:4:4,4:2:2,4:1:1,4:2:0,7.颜色深度,视频数字化后,能否真实反应初原始图像的颜色,引出了颜色深度的概念,颜色深度指每个象素可显示初的颜色数,它与数字化中量化数有着密切的关系,即与量化位数有关。,真彩色 24位,高彩色 16位,位彩色 8位,8.数据量和图像质量,视频是利用快速变换帧的内容而达到运动的效果。,不计压缩,视频的数据量应是帧速乘以每幅图像的数据量。,图像质量除了原始数据质量外,还与视频数据压缩的倍数有关。,有时为了减少数据量而减慢了帧速,例如只有16帧/秒。,二.视频卡,插在PC机主办上,用于处理视频信息的配件卡,主要功能是将模拟视频信号转换成数字化视频信号或将数字信号转换成模拟信号。,根据其功能可分为:,视频采集卡,压缩/解压缩卡,视频输出卡,电视接收卡,三、运动图像压缩标准,为什么要压缩?,长度为半分钟,图象尺寸为640*480像素,30帧/s的非压缩视频的数据量为:,30*640*480*24*30/8=829440000字节791M(不含音频信息),所以压缩和解压技术非常重要,压缩的空间,空间的冗余度:相邻像素之间的相关性造成,频谱冗余度:不同彩色平面之间的相关性造成,时间冗余度:数字视频中不同帧之间的相关性造成,人眼不能辨别的多余信息压缩,运动压缩的基本原理,运动补偿,找出运动图像的相邻帧之间存在的冗余,并以帧速度进行预测压缩,当视频中没有任何运动物体时,只需传送这个景物的第一帧,两个基本问题,怎样区分图像是运动的还是静止的?,如果是运动的,如何提取图像中的运动部分?,MPEG视频压缩标准,MPEG:Moving Picture Experts Group,运动图像专家组,MPEG-1:,1992年发布,应用领域:光盘、数字音频磁带(DAT)、磁带设备等,最典型的应用是VCD,MPEG-2:,1994年被批准为国际标准,主要应用:数字电视、DVD、TV机顶盒,MPEG-4:,1998年发布,1999年公布第二版,多媒体应用标准,MPEG-7:,正在研究,多媒体内容描述接口规范,MPEG-21:,2000年批准制定标准的计划,多媒体框架,将标准集成起来相互支持和相互协调以管理多媒体商务。,MPEG视频压缩工具,豪杰超级解霸3000,RealProducer,各种视频格式转RM(流媒体),四.视频文件格式,AVI文件,Audio Video Interleaved的缩写,Microsoft开发的用于Windows环境,现被Windows、OS/2采用,允许音频和视频交错在一起同步播放,支持256色和RLE压缩,主要应用在多媒体光盘上,用来保存电影、电视等,MOV文件,Apple公司开发用于苹果机的视频文件格式,播放软件:QuickTime,MPEG文件,运动图象压缩算法的国际标准,平均压缩比为50:1,最高可达200:1,DAT文件,是VCD和卡拉OKCD数据文件的扩展名,也是基于MPEG压缩技术的一种文件格式,五、流媒体(扩展内容),什么是流媒体?,流媒体文件格式是支持采用流式传输及播放的媒体格式。,流式传输方式是将动画、视音频等多媒体文件经过特殊的压缩方式分成一个个压缩包,由视频服务器向用户计算机连续、实时传送。,在采用流式传输方式的系统中,用户不必像非流式播放那样等到整个文件全部下载完毕后才能看到当中的内容,而是只需经过几秒或几十秒的启动延时即可在用户的计算机上利用相应的播放器或其它的硬件、软件对压缩的动画、视音频等流式多媒体文件解压后进行播放和观看,多媒体文件的剩余部分将在后台的服务器内继续下载。,与单纯的下载方式相比,这种对多媒体文件边下载边播放的流式传输方式具有以下优点:,启动延时大幅度地缩短,用户不用等待所有内容下载到硬盘上才开始浏览;,对系统缓存容量的需求大大降低由于,Internet,是以包传输为基础进行断续的异步传输,数据被分解为许多包进行传输,动态变化的网络使各个包可能选择不同的路由,故到达用户计算机的时间延迟也就不同。所以,在客户端需要缓存系统来弥补延迟和抖动的影响和保证数据包传输顺序的正确,使媒体数据能连续输出,不会因网络暂时拥堵而使播放出现停顿。虽然流式传输仍需要缓存,但由于不需要把所有的动画、视音频内容都下载到缓存中,因此,对缓存的要求降低。,流媒体文件格式,到目前为止,Internet上使用较多的流媒体格式主要有:,RealNetworks公司的RealMedia,Apple公司的QuickTime,Microsoft公司的WindowsMedia,Macromedia的ShockwaveFlash技术,Windows media服务,Windows Media 服务能够用 ASF、.wmv、.MP3 和.wav 格式向大量客户端提供多媒体内容,其相关工具包括,当前最新版本windows media player 9系列,其核心工具包括Windows Media 编码器,Windows Media Server和Media Player工具构成。,Real System,文件格式主要包括 rm、rmvb,Real System由媒体内容制作工具Real Producer、服务器端RealServer、客户端软件(Client Software)3部分组成。Real流式文件采用Real Producer软件进行制作,首先把源文件或实时输入变为流式文件,再把流式文件传输到服务器上供用户点播。,三、视频编辑软件,视频编辑软件,Adobe Premiere,Ulead Media Studio Pro,Ulead Video Studio,Ulead DVD PictureShow,Movie Maker,展开阅读全文
咨信网温馨提示:1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。




视频与图像基础.ppt



实名认证













自信AI助手
















微信客服
客服QQ
发送邮件
意见反馈



链接地址:https://www.zixin.com.cn/doc/12294354.html