计算机体系结构第1章.ppt
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机体系结构
- 资源描述:
-
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,/77,第,1,章 计算机系统结构的基本概念,张晨曦 刘依,www.,GotoSchool,.net,xzhang2000,1.1,引言,1.2,计算机系统结构的概念,1.3,定量分析技术,1.4,计算机系统结构的发展,1.5,计算机系统结构中并行性的发展,第一台通用电子计算机诞生于,1946,年,计算机技术的飞速发展得益于两个方面,计算机制造技术的发展,计算机系统结构的创新,经历了,4,个发展过程,1.1,引 言,时 间,原 因,每年的性能增长,1946,年起的,25,年,两种因素都起着主要的作用,25%,20,世纪,70,年代末,80,年代初,大规模集成电路和微处理器,出现,以集成电路为代表的制,造技术的发展,约35%,20,世纪,80,年代中开始,RISC,结构的出现,系统结构不断更新和变革,制造技术不断发展,50%,以上,维持了约,16,年,2002,年以来,3,个(见下页),约20%,1.1,引言,1.1,引言,功耗问题(已经很大)。,可以进一步有效开发的指令级并行性已经很少。,存储器访问速度的提高缓慢。,1.1,引言,系统结构的重大转折:,从单纯依靠指令级并行转向开发线程级并行和数据级并行。,计算机系统结构在计算机的发展中有着极其重要的作用。,计算机系统,硬件,/,固件,软件,计算机语言从低级向高级发展,高一级语言的语句相对于低一级语言来说功能更强,,更便于应用,但又都以低级语言为基础。,从计算机语言的角度,把计算机系统按功能划分成,多级层次结构,。,每一层以一种语言为特征,1.2,计算机系统结构的概念,1.2.1,计算机系统的层次结构,软件,硬件或固件,1.2,计算机系统结构的概念,虚拟机,:由软件实现的机器,语言实现的两种基本技术,翻译:,先把,N,+1,级程序全部转换成,N,级程序后,再去执行新产生的,N,级程序,在执行过程中,N,+1,级程序不再被访问。,解释:,每当一条,N,+1,级指令被译码后,就直接去执行一串等效的,N,级指令,然后再去取下一条,N,+1,级的指令,依此重复进行。,解释执行比编译后再执行所花的时间多,但占用的存储空间较少。,1.2,计算机系统结构的概念,计算机系统结构的经典定义,程序员所看到的计算机属性,即概念性结构与功能特性。,按照计算机系统的多级层次结构,不同级程序员所看到的计算机具有不同的属性。,透明性,在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。,1.2.2,计算机系统结构的定义,1.2,计算机系统结构的概念,Amdahl,提出的,系统结构,传统机器语言级程序员所看到的计算机属性。,广义的系统结构定义:指令集结构、组成、硬件,(计算机设计的,3,个方面),对于通用寄存器型机器来说,这些属性主要是指:,指令系统,包括机器指令的操作类型和格式、指令间的,排序和控制机构等。,数据表示,硬件能直接识别和处理的数据类型。,寻址规则,包括最小寻址单元、寻址方式及其表示。,1.2,计算机系统结构的概念,寄存器定义,(包括各种寄存器的定义、数量和使用方式),中断系统,(中断的类型和中断响应硬件的功能等),机器工作状态的定义和切换,(如管态和目态等),存储系统,(主存容量、程序员可用的最大存储容量等),信息保护,(包括信息保护方式和硬件对信息保护的支持),1.2,计算机系统结构的概念,I/O,结构,包括,I/O,连结方式、处理机,/,存储器与,I/O,设备之间,数据传送的方式和格式以及,I/O,操作的状态等,计算机系统结构概念的实质:,确定计算机系统中软、硬件的界面,界面之上是软件实,现的功能,界面之下是硬件和固件实现的功能。,1.2.3,计算机组成和计算机实现,计算机系统结构:,计算机系统的软、硬件的界面,即机器语言程序员所看到的传统机器级所具有的,属性。,1.2,计算机系统结构的概念,计算机组成:,计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及,逻辑设计等。,着眼于:,物理机器级内各事件的排序方式与控制,方式、各部件的功能以及各部件之间的联系。,计算机实现:,计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集,成度和速度,模块、插件、底板的划分与连接,,信号传输,电源、冷却及整机装配技术等。,着眼于:,器件技术(起主导作用)、微组装技术。,1.2,计算机系统结构的概念,一种体系结构可以有多种组成。,一种组成可以有多种物理实现。,系列机,由同一厂家生产的具有相同系统结构、但具有,不同组成和实现的一系列不同型号的计算机。,例如,,IBM,公司的,IBM 370,系列,,Intel,公司的,x86,系列等。,1.2.4,计算机系统结构的分类,常见的计算机系统结构分类法有两种:,Flynn,分类法、冯氏分类法,1.2,计算机系统结构的概念,冯氏分类法,用系统的最大并行度对计算机进行分类。,最大并行度:,计算机系统在单位时间内能够处理,的最大的二进制位数。,用平面直角坐标系中的一个点代表一个计算机系,统,其横坐标表示字宽(,n,位,),纵坐标表示一次能同,时处理的字数(,m,字,)。,m,n,就表示了其最大并行度。,Flynn,分类法,按照指令流和数据流的多倍性进行分类。,指令流:,计算机执行的指令序列。,1.2,计算机系统结构的概念,数据流:,由指令流调用的数据序列。,多倍性:,在系统受限的部件上,同时处于同一执,行阶段的指令或数据的最大数目。,Flynn,分类法把计算机系统的结构分为,4,类:,单指令流单数据流,(SISD),单指令流多数据流,(SIMD),多指令流单数据流,(MISD),多指令流多数据流,(MIMD),4,类,计算机的基本结构,IS,:,指令流,,DS,:,数据流,,CS,:,控制流,,CU,:,控制部件,,PU,:,处理部件,,MM,和,SM,:,存储器。,4,个,定量原理:,以经常性事件为重点,对经常发生的情况采用优化方法的原则进行选,择,以得到更多的总体上的改进。,优化,是指分配更多的资源、达到更高的性能或,者分配更多的电能等。,1.3,定量分析技术,1.3.1,计算机系统设计的定量原理,1.3,定量分析技术,Amdahl,定律,加快某部件执行速度所能获得的系统性能加速,比,受限于该部件的执行时间占系统中总执行时间,的百分比。,系统性能加速比:,加速比,系统性能,改进后,系统性能,改进前,总执行时间,改进前,总执行时间,改进后,1.3,定量分析技术,加速比依赖于两个因素,可改进比例:,在改进前的系统中,可改进部分的执,行时间在总的执行时间中所占的比例。,它总是小于等于,1,。,例如:,一个需运行,60,秒的程序中有,20,秒的运算可以加速,,那么这个比例就是,20/60,。,部件加速比:,可改进部分改进以后性能提高的倍数。,它是改进前所需的执行时间与改进后执行时间的比。,一般情况下部件加速比是大于,1,的。,例如:,若系统改进后,可改进部分的执行时间是,2,秒,,而改进前其执行时间为,5,秒,则部件加速比为,5/2,。,1.3,定量分析技术,改进后程序的总执行时间,总执行时间,改进后,不可改进部分的执行时间 可改进部分改进后的执行时间,总执行时间,改进后,(1,可改进比例,),总执行时间,改进前,+,(1,可改进比例,)+,总执行时间,改进前,可改进比例,部件加速比,可改进比例,总执行时间,改进前,部件加速比,1.3,定量分析技术,系统加速比,为改进前与改进后总执行时间之比,加速比,总执行时间,改进前,总执行时间,改进后,(,1,可改进比例),+,可改进比例,部件加速比,1,1.3,定量分析技术,例,1.1,将计算机系统中某一功能的处理速度提高到原来的,20,倍,但该功能的处理时间仅占整个系统运行时间的,40%,,则采用此提高性能的方法后,能使整个系统的性能提高多少?,解,由题可知,可改进比例,=40%=0.4,,,部件加速比,=20,根据,Amdahl,定律可知:,采用此提高性能的方法后,能使整个系统的性能提高到原来的,1.613,倍,。,总,加速比,=,1,0.6+,0.4,20,=1.613,1.3,定量分析技术,例,1.2,某计算机系统采用浮点运算部件后,使浮点运算速度提高到原来的,20,倍,而系统运行某一程序的整体性能提高到原来的,5,倍,试计算该程序中浮点操作所占的比例。,解,由题可知,部件加速比,=20,,系统加速比,=5,根据,Amdahl,定律可知,由此可得:可改进比例,=84.2%,即程序中浮点操作所占的比例为,84.2%,。,1.3,定量分析技术,Amdahl,定律,:,一种性能改进的递减规则,如果仅仅对计算任务中的一部分做性能改进,则改,进得越多,所得到的总体性能的提升就越有限。,重要推论:,如果只针对整个任务的一部分进行改,进和优化,那么所获得的加速比不超过,1/,(,1,可改进比例),1.3,定量分析技术,CPU,性能公式,执行一个程序所需的,CPU,时间,CPU,时间,=,执行程序所需的时钟周期数,时钟周期时间,其中,时钟周期时间是系统时钟频率的倒数。,每条指令执行的平均时钟周期数,CPI,(,Cycles Per Instruction,),CPI,=,执行程序所需的时钟周期数,IC,IC,:,所执行的指令条数,程序执行的,CPU,时间可以写成,CPU,时间,=,IC CPI,时钟周期时间,1.3,定量分析技术,CPU,的性能取决于,3,个参数,时钟周期时间:,取决于硬件实现技术和计算机组成。,CPI,:,取决于计算机组成和指令集结构。,IC,:,取决于指令集结构和编译技术。,对,CPU,性能公式进行进一步细化,假设:计算机系统有,n,种指令;,CPI,i,:,第,i,种指令的处理时间;,IC,i,:,在程序中第,i,种指令出现的次数;,则,CPU,时钟周期数,=,(,CPI,i,IC,i,),n,i,=1,1.3,定量分析技术,CPU,时间,=,执行程序所需的时钟周期数,时钟周期时间,=,(,CPI,i,IC,i,),时钟周期时间,CPI,可以表示为,CPI,=,其中,,(,IC,i,/IC,),反映了第,i,种指令在程序中所占的比例。,i,=1,n,时钟周期数,IC,(CPI,i,IC,i,),i,=1,n,IC,(,CPI,i,),i,=1,n,IC,i,IC,1.3,定量分析技术,例,1.3,考虑条件分支指令的两种不同设计方法:,(,1,),CPU,A,:,通过比较指令设置条件码,然后测试条件码进行分支。,(,2,),CPU,B,:,在分支指令中包括比较过程。,在这两种,CPU,中,条件分支指令都占用,2,个时钟周期,而所有其他指令占用,1,个时钟周期。对于,CPU,A,,,执行的指令中分支指令占,20%,;由于每条分支指令之前都需要有比较指令,因此比较指令也占,20%,。由于,CPU,A,在分支时不需要比较,因此,CPU,B,的时钟周期时间是,CPU,A,的,1.25,倍。问:哪一个,CPU,更快?如果,CPU,B,的时钟周期时间只是,CPU,A,的,1.1,倍,哪一个,CPU,更快呢?,1.3,定量分析技术,解,我们不考虑所有系统问题,所以可用,CPU,性能公式。占用,2,个时钟周期的分支指令占总指令的,20%,,剩下的指令占用,1,个时钟周期。所以,CPI,A,=0.2,2+0.80,1=1.2,则,CPU,A,性能为,总,CPU,时间,A,=IC,A,1.2,时钟周期,A,根据假设,有,时钟周期,B,=1.25,时钟周期,A,在,CPU,B,中没有独立的比较指令,所以,CPU,B,的程序量为,CPU,A,的,80%,,分支指令的比例为,1.3,定量分析技术,20%/80%=25%,这些分支指令占用,2,个时钟周期,而剩下的,75%,的指令占用,1,个时钟,周期,因此,CPI,B,=0.25,2+0.75,1=1.25,因为,CPU,B,不执行比较,故,IC,B,=0.8,IC,A,因此,CPU,B,性能为,总,CPU,时间,B,=IC,B,CPI,B,时钟周期,B,=0.8,IC,A,1.25,(,1.25,时钟周期,A,),=1.25,IC,A,时钟周期,A,1.3,定量分析技术,在这些假设之下,尽管,CPU,B,执行指令条数较少,,CPU,A,因为有着更,短的时钟周期,所以比,CPU,B,快。,如果,CPU,B,的时钟周期时间仅仅是,CPU,A,的,1.1,倍,则,时钟周期,B,=1.10,时钟周期,A,CPU,B,的性能为,总,CPU,时间,B,=IC,B,CPI,B,时钟周期,B,=0.8,IC,A,1.25,(,1.10,时钟周期,A,),=1.10,IC,A,时钟周期,A,因此,CPU,B,由于执行更少指令条数,比,CPU,A,运行更快。,1.3,定量分析技术,程序的局部性原理,程序执行时所访问的存储器地址分布不是随机,的,而是相对地簇聚。,常用的一个经验规则,程序执行时间的,90%,都是在执行程序中,10%,的代码。,程序的时间局部性,程序即将用到的信息很可能就是目前正在使用的信息。,程序的空间局部性,程序即将用到的信息很可能与目前正在使用的信息,在空间上相邻或者临近。,1.3,定量分析技术,执行时间和吞吐率,如何评测一台计算机的性能,与测试者看问题,的角度有关。,用户关心的是:,单个程序的,执行时间,(执行单个,程序所花的时间很少),数据处理中心的管理员关心的是:,吞吐率,(在单,位时间里能够完成的任务很多),1.3.2,计算机系统的性能评测,1.3,定量分析技术,假设两台计算机为,X,和,Y,,,X,比,Y,快,的意思是:,对于给定任务,,X,的执行时间比,Y,的执行时间少。,X,的性能是,Y,的,n,倍,即,而执行时间与性能成反比,即,执行时间,Y,执行时间,X,=,n,n,=,执行时间,Y,执行时间,X,性能,Y,1,性能,X,1,性能,X,性能,Y,1.3,定量分析技术,执行时间可以有多种定义:,计算机完成某一任务所花费的全部时间,包括,磁盘访问、存储器访问、输入,/,输出、操作系统开销等。,CPU,时间:,CPU,执行所给定的程序所花费的时间,不包含,I/O,等待时间以及运行其他程序的时间。,用户,CPU,时间:,用户程序所耗费的,CPU,时间。,系统,CPU,时间:,用户程序运行期间操作系统耗费的,CPU,时间。,1.3,定量分析技术,基准测试程序,用于测试和比较性能的基准测试程序的最佳选择是,真实应用程序。,(例如编译器),以前常采用简化了的程序,例如:,核心测试程序:,从真实程序中选出的关键代码段构,成的小程序。,小测试程序:,简单的只有几十行的小程序。,合成的测试程序:,人工合成出来的程序。,Whetstone,与,Dhrystone,是最流行的合成测试程序。,从测试性能的角度来看,上述测试程序就不可信了。,1.3,定量分析技术,原因:,这些程序比较小,具有片面性;,系统结构设计者和编译器的设计者可以“合谋”把他,们的计算机面向这些测试程序进行优化设计,使得,该计算机显得性能更高。,性能测试的结果除了和采用什么测试程序有关以,外,还和,在什么条件下进行测试,有关。,基准测试程序设计者对制造商的要求,采用同一种编译器;,对同一种语言的程序都采用相同的一组编译标志。,1.3,定量分析技术,一个问题:,是否允许修改测试程序的源程序,三种不同的处理方法:,不允许修改。,允许修改,但因测试程序很复杂或者很大,几乎是,无法修改。,允许修改,只要保证最后输出的结果相同。,基准测试程序套件:,由各种不同的真实应用程序,构成。,(能比较全面地反映计算机在各个方面的处理性能),SPEC,系列:,最成功和最常见的测试程序套件,(美国的标准性能评估公司开发),1.3,定量分析技术,台式计算机的基准测试程序套件可以分为两大类:,处理器性能测试程序,图形性能测试程序,SPEC89,:,用于测试处理器性能。,10,个程序(,4,个整数程,序,,6,个浮点程序),演化出了,4,个版本,SPEC92,:,20,个程序,SPEC95,:,18,个程序,SPEC2000,:,26,个程序,SPEC CPU2006,:,29,个程序,SPEC CPU2006,1.3,定量分析技术,整数程序,12,个(,CINT2006,),9,个是用,C,写的,,3,个是用,C+,写的,浮点程序,17,个(,CFP2006,),6,个是用,FORTRAN,写的,,4,个是用,C+,写的,,3,个,是用,C,写的,,4,个是用,C,和,FORTRAN,混合编写的。,SPEC,测试程序套件中的其他一系列测试程序组件,SPECSFS,:,用于,NFS,(,网络文件系统)文件服务器的测,试程序。它不仅测试处理器的性能,而且测试,I/O,系统,的性能。它重点测试吞吐率。,SPECWeb,:,Web,服务器测试程序。,1.3,定量分析技术,SPECviewperf,:,用于测试图形系统支持,OpenGL,库,的性能。,SPECapc,:,用于测试图形密集型应用的性能。,事务处理(,TP,),性能测试基准程序:,用于测试计算机在事务处理方面的能力,包括数据库访问,和更新等。,20,世纪,80,年代中期,一些工程师成立了称为,TPC,的独立组织。目的是开发用于,TP,性能测试的真实而又公平的基准程序。,先后发布了多个版本:,TPC-A,、,TPC-C,、,TPC-H,、,TPC-W,、,TPC-App,等,(主要是用于测试服务器的性能 ),1.3,定量分析技术,用于测试基于,Microsoft,公司的,Windows,系列操作,系统平台的测试套件,PCMark04,:,中央处理器测试组、内存测试组、图形芯片测试组、硬盘测试组等。,Business,Winstone,2004,:,主要用于测试计算机系统,商业应用的综合性能。,Multimedia Content Creation,Winstone,2004,:,主要用于测试计算机系统多媒体应用的综合性能。,SiSoft,Sandra Pro 2004,:,一套功能强大的系统分析,评比工具,拥有超过,30,种以上的分析与测试模块。,主要包括:,CPU,、,存储器、,I/O,接口、,I/O,设备、主板等。,性能比较,A,机,B,机,C,机,W,(1),W,(2),W,(3),程序,1,1.00,10.00,20.00,0.50,0.909,0.999,程序,2,1000.00,10.00,20.00,0.50,0.091,0.001,加权算术,平均值,A,m,(,1,),500.50,10.00,20.00,加权算术,平均值,A,m,(,2,),91.91,10.00,20.00,加权算术,平均值,A,m,(,3,),2.00,10.00,20.00,两个程序,在,A,、,B,、,C,三台计算机上的执行时间,1.3,定量分析技术,如何比较这,3,台计算机的性能呢?,从该表可以得出:,执行程序,1:,A,机,的速度是,B,机,的,10,倍,A,机,的速度是,C,机,的,20,倍,B,机,的速度是,C,机,的,2,倍,执行程序,2:,B,机,的速度是,A,机,的,100,倍,C,机,的速度是,A,机,的,50,倍,B,机,的速度是,C,机,的,2,倍,1.3,定量分析技术,总执行时间:,计算机执行所有测试程序的总时间,B,机,执行程序,1,和程序,2,的速度是,A,机,的,50.05,倍,C,机,执行程序,1,和程序,2,的速度是,A,机,的,24.02,倍,B,机,执行程序,1,和程序,2,的速度是,C,机,的,2,倍,平均执行时间:,各测试程序执行时间的算术平均值,其中,,,T,i,:第,i,个测试程序的执行时间,n,:,测试程序组中程序的个数,1.3,定量分析技术,加权执行时间:,各测试程序执行时间的加权平均值,其中,,W,i,:第,i,个测试程序在测试程序组中所占的比重,T,i,:,该程序的执行时间,1.4,计算机系统结构的发展,1.4.1,冯,诺依曼结构,存储程序计算机的结构,1.4,计算机系统结构的发展,存储程序原理的基本点:,指令驱动,程序预先存放在计算机存储器中,计算机一旦启,动,就能按照程序指定的逻辑顺序执行这些程序,,自动完成由程序所描述的处理工作。,冯,诺依曼结构的,主要特点,以运算器为中心。,在存储器中,指令和数据同等对待。,指令和数据一样可以进行运算,即由指令组成的程,序是可以修改的。,存储器是按地址访问、按顺序线性编址的一维结,构,每个单元的位数是固定的。,1.4,计算机系统结构的发展,指令的执行是顺序的。,一般是按照指令在存储器中存放的顺序执行。,程序的分支由转移指令实现。,由指令计数器,PC,指明当前正在执行的指令在存储器,中的地址。,指令由操作码和地址码组成。,指令和数据均以二进制编码表示,采用二进制运算。,1.4,计算机系统结构的发展,对系统结构进行的改进,输入,/,输出方式的改进,采用并行处理技术,如何挖掘传统机器中的并行性?,在不同的级别采用并行技术。,例如,微操作级、指令级、线程级、进程级、任务级等。,1.4,计算机系统结构的发展,存储器组织结构的发展,相联存储器与相联处理机,通用寄存器组,高速缓冲存储器,Cache,指令集的发展,两个发展方向:,复杂指令集计算机(,CISC,),精减指令集计算机(,RISC,),1.4,计算机系统结构的发展,软件的可移植性:,一个软件可以不经修改或者只,需少量修改就可以由一台计算机移植到另一台计算机上正确地运行。差别只是执行时间的不同。,我们称这两台计算机是,软件兼容,的。,实现可移植性的常用方法,采用系列机,模拟与仿真,统一高级语言。,1.4.2,软件对系统结构的影响,系列机,由同一厂家生产的具有相同的系统结构,但具,有不同组成和实现的一系列不同型号的机器。,较好地解决软件开发要求系统结构相对稳定与器,件、硬件技术迅速发展的矛盾。,软件兼容,1.4,计算机系统结构的发展,1.4,计算机系统结构的发展,向上(下)兼容:,按某档机器编制的程序,不加修改,就能运行于比它高(低)档的机器。,向前(后)兼容:,按某个时期投入市场的某种型号机,器编制的程序,不加修改地就能运行于在它之前,(后)投入市场的机器。,向后兼容是系列机的根本特征。,兼容机:,由不同公司厂家生产的具有相同系统结,构的计算机。,1.4,计算机系统结构的发展,模拟和仿真,使软件能在具有不同系统结构的机器之间相互移植。,在一种系统结构上实现另一种系统结构。,从指令集的角度来看,就是要在一种机器上实现,另一种机器的指令集。,模拟:,用软件的方法在一台现有的机器(称为,宿主机,)上实现另一台机器(称为,虚拟机,)的指令集。,通常用解释的方法来实现。,运行速度较慢,性能较差。,1.4,计算机系统结构的发展,仿真:,用一台现有机器(,宿主机,)上的微程序,去解释实现另一台机器(,目标机,)的指令集。,运行速度比模拟方法的快,仿真只能在系统结构差距不大的机器之间使用,统一高级语言,实现软件移植的一种理想的方法,较难实现,1.4,计算机系统结构的发展,摩尔定律,集成电路芯片上所集成的晶体管数目每隔,18,个,月就翻一番。,计算机的分代主要以器件作为划分标准。,它们在器件、系统结构和软件技术等方面都有各,自的特征。,SMP,:,对称式共享存储器多处理机,MPP,:,大规模并行处理机,1.4.3,器件发展对系统结构的影响,分代,器件特征,结构特征,软件特征,典型实例,第一代,(,1945,1954,年),电子管和继电器,存储程序计算机,程序控制,I/O,机器语言,汇编语言,普林斯顿,ISA,,,ENIAC,,,IBM 701,第二代,(,1955,1964,年),晶体管、磁芯,印刷电路,浮点数据表示,寻址技术,中断、,I/O,处理机,高级语言和编译,批处理监控系统,Univac LAPC,,CDC 1604,,IBM 7030,第三代,(,1965,1974,年),SSI,和,MSI,多层印刷电路,微程序,流水线、,Cache,先行处理,系列机,多道程序,分时操作系统,IBM 360/370,,CDC 6600/7600,,DEC PDP-8,第四代,(,1975,1990,年),LSI,和,VLSI,半导体存储器,向量处理,分布式存储器,并行与分布处理,Cray-1,IBM 3090,DEC VAX 9000,Convax-1,第五代,(,1991,年,),高性能微处理器高密度电路,超标量、超流水,SMP,、,MP,、,MPP,机群,大规模、可扩展,并行与分布处理,SGI Cray T3E,,,IBM SP2,,,DEC,AlphaServer,8400,1.4,计算机系统结构的发展,不同的应用对计算机系统结构的设计提出了不同的要求,应用需求是促使计算机系统结构发展的,最根本的动力,一些特殊领域:需要高性能的系统结构,高结构化的数值计算,气象模型、流体动力学、有限元分析,非结构化的数值计算,蒙特卡洛模拟、稀疏矩阵,实时多因素问题,语音识别、图像处理、计算机视觉,1.4.4,应用对系统结构的影响,1.4,计算机系统结构的发展,大存储容量和输入输出密集的问题,数据库系统、事务处理系统,图形学和设计问题,计算机辅助设计,人工智能,面向知识的系统、推理系统等,计算机性能随时间下移,1.4,计算机系统结构的发展,系统结构的,生命周期:,从诞生、发展、成熟到消亡,从硬件成熟到系统软件成熟大约需要,5,7,年,的时间,从系统软件成熟到应用软件成熟,大约也需要,5,7,年,时间。,再过,5,7,年,的时间,这种系统结构就不会作为主流系统结构存在了。,Intel,的,x86,系列微处理器中,32,位系统结构的发展,1.4.5,系统结构的生命周期,1.4,计算机系统结构的发展,并行性:,计算机系统在同一时刻或者同一时间间隔内,进行多种运算或操作。,只要在时间上相互重叠,就存在并行性。,同时性:,两个或两个以上的事件在同一时刻发生。,并发性:,两个或两个以上的事件在同一时间间隔,内发生。,1.5,计算机系统结构中并行性的发展,1.5.1,并行性的概念,1.5,计算机系统结构中并行性的发展,从处理数据的角度来看,,并行性等级,从低到高可分为:,字串位串:,每次只对一个字的一位进行处理。,最基本的串行处理方式,不存在并行性。,字串位并:,同时对一个字的全部位进行处理,不,同字之间是串行的。,开始出现并行性。,字并位串:,同时对许多字的同一位(称为,位片,),进行处理。,具有较高的并行性。,全并行:,同时对许多字的全部位或部分位进行处理。,最高一级的并行。,1.5,计算机系统结构中并行性的发展,从执行程序的角度来看,并行性等级从低到高可分为:,指令内部并行:,单条指令中各微操作之间的并行。,指令级并行:,并行执行两条或两条以上的指令。,线程级并行:,并行执行两个或两个以上的线程。,通常是以一个进程内派生的多个线程为调度单位。,任务级或过程级并行:,并行执行两个或两个以上,的过程或任务(程序段),以子程序或进程为调度单元。,作业或程序级并行:,并行执行两个或两个以上的,作业或程序。,1.5,计算机系统结构中并行性的发展,三种途径:,时间重叠,引入时间因素,让多个处理过程在时间上相,互错开,轮流重叠地使用同一套硬件设备的各个,部分,以加快硬件周转而赢得速度。,资源重复,引入空间因素,以数量取胜。通过重复设置,硬件资源,大幅度地提高计算机系统的性能。,1.5.2,提高,并行性的技术途径,1.5,计算机系统结构中并行性的发展,资源共享,这是一种软件方法,它使多个任务按一定时间,顺序轮流使用同一套硬件设备。,1.5,计算机系统结构中并行性的发展,在发展高性能单处理机过程中,起主导作用的是时间,重叠原理。,实现时间重叠的基础:,部件功能专用化,把一件工作按功能分割为若干相互联系的部分;,把每一部分指定给专门的部件完成;,按时间重叠原理把各部分的执行过程在时间上,重叠起来,使所有部件依次分工完成一组同样的工作。,1.5.3,单机系统中,并行性的发展,1.5,计算机系统结构中并行性的发展,例如:,对于解释指令的,5,个过程,就分别需要,5,个专用的部件:取指令部件,(IF),、,指令译码部件,(ID),、,指令执行部件,(EX),、,访问存储器部件,(M),和,写结果部件,(WB),。,1.5,计算机系统结构中并行性的发展,在单处理机中,资源重复原理的运用也已经十分普遍。,多体存储器,多操作部件,通用部件被分解成若干个专用部件,如加法部件、乘,法部件、除法部件、逻辑运算部件等,而且同一种部,件也可以重复设置多个。,只要指令所需的操作部件空闲,就可以开始执行这条,指令(如果操作数已准备好的话)。,这实现了,指令级并行,。,1.5,计算机系统结构中并行性的发展,阵列处理机(并行处理机),更进一步,设置许多相同的处理单元,让它们在同,一个控制器的指挥下,按照同一条指令的要求,对向量,或数组的各元素同时进行同一操作,就形成了阵列处理,机。,在单处理机中,资源共享的概念实质上是用单处理机,模拟多处理机的功能,形成所谓,虚拟机,的概念。,分时系统,1.5,计算机系统结构中并行性的发展,多机系统遵循时间重叠、资源重复、资源共享原理,发展为,3,种不同的多处理机:,同构型多处理机、异构型多处理机、分布式系统,耦合度,反映多机系统中各机器之间物理连接的紧密程,度和交互作用能力的强弱。,紧密耦合系统(直接耦合系统):,在这种系统,中,计算机之间的物理连接的频带较高,一般是,1.5.4,多机系统中,并行性的发展,1.5,计算机系统结构中并行性的发展,通过总线或高速开关互连,可以共享主存。,松散耦合系统(间接耦合系统):,一般是通过通,道或通信线路实现计算机之间的互连,可以共享,外存设备(磁盘、磁带等)。机器之间的相互作,用是在文件或数据集一级上进行的。,表现为两种形式:,多台计算机和共享的外存设备连接,不同机器之间实现功能上的分工(功能专用化),机器处理的结果以文件或数据集的形式送到共享外存设备,供其他机器继续处理。,计算机网络,通过通信线路连接,实现更大范围的资源共享。,1.5,计算机系统结构中并行性的发展,功能专用化(实现时间重叠),专用外围处理机,例如,输入,/,输出功能的分离。,专用处理机,如数组运算、高级语言翻译、数据库管理等,分离出来。,异构型多处理机系统,由多个不同类型、至少担负不同功能的处理机组成,,它们按照作业要求的顺序,利用时间重叠原理,依次对,它们的多个任务进行加工,各自完成规定的功能动作。,1.5,计算机系统结构中并行性的发展,机间互连,容错系统,可重构系统,对计算机之间互连网络的性能提出了更高的要求。,高带宽、低延迟、低开销的机间互连网络是高效实现程,序或任务一级并行处理的前提条件。,同构型多处理机系统,由多个同类型或至少担负同等功能的处理机组成,,它们同时处理同一作业中能并行执行的多个任务。,展开阅读全文
咨信网温馨提示:1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。




计算机体系结构第1章.ppt



实名认证













自信AI助手
















微信客服
客服QQ
发送邮件
意见反馈



链接地址:https://www.zixin.com.cn/doc/13234332.html