安腾高性能处理机体系结构.pptx
《安腾高性能处理机体系结构.pptx》由会员分享,可在线阅读,更多相关《安腾高性能处理机体系结构.pptx(31页珍藏版)》请在咨信网上搜索。
1、计算机组成原理计算机组成原理湘南学院湘南学院首页首页上页上页下页下页退出退出10.1 高性能高性能处理机体系理机体系结构的演构的演变一、一、IA体系结构的历史演变体系结构的历史演变二、英特尔二、英特尔64位处理机的两种体系结构位处理机的两种体系结构计算机组成原理计算机组成原理湘南学院湘南学院首页首页上页上页下页下页退出退出10.1高性能高性能处理机体系理机体系结构的演构的演变一、一、IA体系结构的历史演变体系结构的历史演变IA32体系结构:IA32家族中的第一款32位微处理机流水技术IA32体系结构仍是基于CISC架构的处理机。Pentium体系结构:CISC外壳加RISC内核的结构计算机组成
2、原理计算机组成原理湘南学院湘南学院首页首页上页上页下页下页退出退出10.1高性能高性能处理机体系理机体系结构的演构的演变二、英特尔二、英特尔64位处理机的两种体系结构位处理机的两种体系结构1、64T(英特尔64):基于显式并行指令计算EPIC(Explicitly Parallel Instruction Computing)技术的IA64体系结构,不与IA32指令系统的兼容性。2、安腾体系结构:与IA32指令系统的兼容性。计算机组成原理计算机组成原理湘南学院湘南学院首页首页上页上页下页下页退出退出10.2安安腾体系体系结构的基本构的基本设计思想思想n安腾体系结构脱离了安腾体系结构脱离了IA3
3、2 CISC体系结构的束缚,体系结构的束缚,但并没有完全照搬但并没有完全照搬RISC处理机的设计思想。处理机的设计思想。EPIC既不是既不是RISC,也不是,也不是CISC,而是一种吸收了,而是一种吸收了CISC和和RISC两者长处的全新的体系结构。主要体两者长处的全新的体系结构。主要体现在以下几个方面:现在以下几个方面:显式并行指令计算(EPIC)技术超长指令字(VLIW)技术分支推断技术推测技术软件流水技术寄存器堆栈技术计算机组成原理计算机组成原理湘南学院湘南学院首页首页上页上页下页下页退出退出10.2安安腾体系体系结构的基本构的基本设计思想思想1、显式并行指令计算、显式并行指令计算(EP
4、IC)技术技术n安腾的指令中设计了属性字段,用于指明哪些指令可安腾的指令中设计了属性字段,用于指明哪些指令可以并行执行。这些属性信息并不是在指令执行过程中以并行执行。这些属性信息并不是在指令执行过程中由处理机判定后获得的,而是由编译程序在编译时通由处理机判定后获得的,而是由编译程序在编译时通过对源代码的分析获取指令级的并行性信息,并填写过对源代码的分析获取指令级的并行性信息,并填写到执行代码中。这就是所谓显式并行的概念。到执行代码中。这就是所谓显式并行的概念。nEPIC技术则充分利用现代编译程序强大的对程序执行技术则充分利用现代编译程序强大的对程序执行过程的调度能力,由专用的过程的调度能力,由
5、专用的EPIC编译器首先分析源代编译器首先分析源代码,根据指令之间的依赖关系最大限度地挖掘指令级码,根据指令之间的依赖关系最大限度地挖掘指令级的并行性,从而确定哪些指令可以并行执行,然后把的并行性,从而确定哪些指令可以并行执行,然后把并行指令放在一起并重新排序,提取并调度其指令级并行指令放在一起并重新排序,提取并调度其指令级的并行,并将这种并行性通过属性字段的并行,并将这种并行性通过属性字段“显式显式”地告地告知指令执行部件。知指令执行部件。计算机组成原理计算机组成原理湘南学院湘南学院首页首页上页上页下页下页退出退出10.2安安腾体系体系结构的基本构的基本设计思想思想2、超长指令字、超长指令字
6、(VLIW)技术技术n超长指令字超长指令字(VLIW)技术是提高计算机系统并行性的技术是提高计算机系统并行性的有效手段。有效手段。VLIW系统中指令字长可多达几百位,编系统中指令字长可多达几百位,编译器经过优化,能将多条能够并行执行的指令合并成译器经过优化,能将多条能够并行执行的指令合并成一个具有多个操作码的超长指令字,控制多个独立的一个具有多个操作码的超长指令字,控制多个独立的功能部件工作。功能部件工作。nEPIC是基于超长指令字的设计。是基于超长指令字的设计。n通过将多条指令放入一个超长指令字,能有效提高处通过将多条指令放入一个超长指令字,能有效提高处理机内各个执行部件的利用率。理机内各个
7、执行部件的利用率。计算机组成原理计算机组成原理湘南学院湘南学院首页首页上页上页下页下页退出退出10.2安安腾体系体系结构的基本构的基本设计思想思想3、分支推断技术、分支推断技术n技术能将传统的技术能将传统的“ifthenelse”分支结构转变为无分支结构转变为无分支的顺序分支的顺序/并行代码,以避免由于错误预测分支而付出代价。并行代码,以避免由于错误预测分支而付出代价。当处理机在运行中遇到分支时,它并不是进行传统的分支预当处理机在运行中遇到分支时,它并不是进行传统的分支预测并选择可能性最大的一个分支执行,而是按分支的所有可测并选择可能性最大的一个分支执行,而是按分支的所有可能的后续路径开始并行
8、执行多段代码并暂存各段代码的执行能的后续路径开始并行执行多段代码并暂存各段代码的执行结果,直到处理机能够确认分支转移与否的条件是真是假时,结果,直到处理机能够确认分支转移与否的条件是真是假时,处理机再把应该选择的路径上的指令执行结果保留下来。处理机再把应该选择的路径上的指令执行结果保留下来。n采用了推断技术后,原有的转移指令被转换成条件执行指令。采用了推断技术后,原有的转移指令被转换成条件执行指令。原有的转移指令的所有的分支都被并行执行,无论哪条分支原有的转移指令的所有的分支都被并行执行,无论哪条分支将被命中,都不会出现流水线断流现象,故消除了因分支预将被命中,都不会出现流水线断流现象,故消除
9、了因分支预测失误而重新装载流水线导致的低效率现象。更进一步,以测失误而重新装载流水线导致的低效率现象。更进一步,以前由于程序分支和指令依赖等因素不能并行执行的许多指令前由于程序分支和指令依赖等因素不能并行执行的许多指令现在完全可以并行执行,从而提高了处理机的执行效率。现在完全可以并行执行,从而提高了处理机的执行效率。计算机组成原理计算机组成原理湘南学院湘南学院首页首页上页上页下页下页退出退出10.2安安腾体系体系结构的基本构的基本设计思想思想4、推测技术、推测技术n推测技术,包括控制推测和数据推测,以减少存储器推测技术,包括控制推测和数据推测,以减少存储器访问响应时间的影响。访问响应时间的影响
10、。n控制推测技术和数据推测技术允许提前执行从内存单控制推测技术和数据推测技术允许提前执行从内存单元至通用寄存器的取数指令。当程序中有分支时,控元至通用寄存器的取数指令。当程序中有分支时,控制推测技术将位于分支指令之后的取数指令提前若干制推测技术将位于分支指令之后的取数指令提前若干周期执行,以此消除访存延时,提高指令执行的并行周期执行,以此消除访存延时,提高指令执行的并行度。而数据推测技术则用于解决提前取数指令后的数度。而数据推测技术则用于解决提前取数指令后的数据相关性问题。据相关性问题。n推测技术避免了推测技术避免了cache命中失败而导致访存延迟的损命中失败而导致访存延迟的损失,消除了因处理
11、机空闲而导致的并行性降低的缺憾。失,消除了因处理机空闲而导致的并行性降低的缺憾。计算机组成原理计算机组成原理湘南学院湘南学院首页首页上页上页下页下页退出退出10.2安安腾体系体系结构的基本构的基本设计思想思想5、软件流水技术、软件流水技术n安腾体系结构提供了很强的硬件支持,使循环执行过安腾体系结构提供了很强的硬件支持,使循环执行过程中一次循环的代码执行与下一次循环代码的执行在程中一次循环的代码执行与下一次循环代码的执行在时间上部分重叠,也即下一个循环步可以在上一个循时间上部分重叠,也即下一个循环步可以在上一个循环步结束前开始执行。环步结束前开始执行。n安腾体系结构引入了新机制来支持软件流水,包
12、括自安腾体系结构引入了新机制来支持软件流水,包括自动寄存器重命名、推断执行和特殊的循环终止指令。动寄存器重命名、推断执行和特殊的循环终止指令。因此,安腾处理机能够通过旋转寄存器机制为每个循因此,安腾处理机能够通过旋转寄存器机制为每个循环步提供自己的寄存器,并且不需要把循环扩展开来。环步提供自己的寄存器,并且不需要把循环扩展开来。n安腾体系结构中硬件对编译器管理软件流水线的支持安腾体系结构中硬件对编译器管理软件流水线的支持使得编译器能够生成精简的代码,以高度并行的方式使得编译器能够生成精简的代码,以高度并行的方式实现循环操作。实现循环操作。计算机组成原理计算机组成原理湘南学院湘南学院首页首页上页
13、上页下页下页退出退出10.2安安腾体系体系结构的基本构的基本设计思想思想6、寄存器堆栈技术、寄存器堆栈技术n安腾处理机利用安腾处理机利用128个通用寄存器中的个通用寄存器中的96个堆栈寄存个堆栈寄存器实现寄存器堆栈,并在处理机内部设置一个寄存器器实现寄存器堆栈,并在处理机内部设置一个寄存器堆栈引擎堆栈引擎RSE来管理寄存器堆栈。当来管理寄存器堆栈。当96个堆栈寄存个堆栈寄存器不够用时,寄存器堆栈引擎能够自动将寄存器堆栈器不够用时,寄存器堆栈引擎能够自动将寄存器堆栈与内存储器对接,将寄存器堆栈溢出的数据转移到内与内存储器对接,将寄存器堆栈溢出的数据转移到内存储器中保存,或在寄存器堆栈弹出数据时执
14、行反向存储器中保存,或在寄存器堆栈弹出数据时执行反向操作。这样,编译器将看到一个容量没有限制的寄存操作。这样,编译器将看到一个容量没有限制的寄存器堆栈空间。器堆栈空间。计算机组成原理计算机组成原理湘南学院湘南学院首页首页上页上页下页下页退出退出10.3安安腾指令系指令系统结构构一、执行单元与指令类型一、执行单元与指令类型 为提高并行处理能力,安腾处理机内部设置了多个为提高并行处理能力,安腾处理机内部设置了多个执行单元。这些执行单元被分为四类:执行单元。这些执行单元被分为四类:I单元单元:整数执行单元,用于执行整数算术运算、逻辑运算、移位和比特处理等指令,以及32位数据和指针操作。M单元单元:存
15、储器执行单元,用于执行通用寄存器、浮点寄存器和存储器之间的取数(load)指令、存数(store)指令以及某些整数ALU运算指令。B单元单元:转移执行单元,用于执行转移分支类指令。F单元单元:浮点执行单元,用于执行浮点运算指令。相应地,安腾指令系统中的所有指令被分成六种类型,每种指令使用一种或多种执行单元。计算机组成原理计算机组成原理湘南学院湘南学院首页首页上页上页下页下页退出退出10.3安安腾指令系指令系统结构构二、安腾寄存器结构二、安腾寄存器结构与RISC体系结构类似,安腾体系结构大量使用寄存器操作;见下一页图只有取数load和存数store指令才能够访问内存,所有其他指令都在寄存器上操作
16、。在以安腾为基础的处理机内,用户可直接使用的寄存器数量甚至大大超过了主流RISC处理机。一方面可以加快数据存取的速度,减少访存延迟,另一方面可以更好地支持并行操作。计算机组成原理计算机组成原理湘南学院湘南学院首页首页上页上页下页下页退出退出10.3安安腾指令系指令系统结构构三、安腾指令格式三、安腾指令格式典型指令格式:安腾的每条指令占41位。n对于寄存器操作数,需要7位选择128个通用寄存器或浮点寄存器。故一条典型的RRR型安腾指令需要21位来标识两个源寄存器操作数和一个目标寄存器操作数。n大多数指令还需要一个6位字段选择64个推断寄存器之一,用于支持推断执行、软件流水等功能。指令束格式安腾体
17、系结构采用超长指令字技术,利用集束指令合成;计算机组成原理计算机组成原理湘南学院湘南学院首页首页上页上页下页下页退出退出10.3安安腾指令系指令系统结构构n指令组指令组指令组将相互之间没有读后写相关,写后写相关,可以并行执行的一组指令集合。n指令束模版指令束模版模版字段正是为实现EPIC的设计思想服务的:一方面,编译器可以通过5位模版字段指明每个指令槽中的指令使用哪一个执行单元;另一方面,编译器可以通过模板字段明确给出指令束内或指令束间的依赖关系。计算机组成原理计算机组成原理湘南学院湘南学院首页首页上页上页下页下页退出退出10.3安安腾指令系指令系统结构构四、安腾汇编语言格式四、安腾汇编语言格
18、式qpMnemonic.Comp1.Comp2 dest=srcqpMnemonic.Comp1.Comp2 dest=srcmnemonicmnemonic为指令助记符。为指令助记符。destdest为目标操作数,指明存放运算结果的寄存器。为目标操作数,指明存放运算结果的寄存器。srcsrc为源操作数,给出若干个寄存器操作数或立即数。为源操作数,给出若干个寄存器操作数或立即数。qpqp选择选择6464个推断寄存器之一。在指令执行时,如果选个推断寄存器之一。在指令执行时,如果选定的一比特推断寄存器的当前值为定的一比特推断寄存器的当前值为1 1,则该指令的执行结,则该指令的执行结果最终会被硬件采
19、用;否则,该指令的执行结果将被硬果最终会被硬件采用;否则,该指令的执行结果将被硬件放弃。对于不需要推断寄存器的指令,在机器指令中件放弃。对于不需要推断寄存器的指令,在机器指令中将默认指定推断寄存器将默认指定推断寄存器0 0,该寄存器的值固定为,该寄存器的值固定为0 0。因此,。因此,所有的指令都可以看作是条件执行的。所有的指令都可以看作是条件执行的。.comp1.Cp1.Comp2 为指令完成符,用于进一步限定指为指令完成符,用于进一步限定指令所需完成的操作。令所需完成的操作。计算机组成原理计算机组成原理湘南学院湘南学院首页首页上页上页下页下页退出退出10.4指令指令级并行机制并行机制一、推断
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 安腾高 性能 处理机 体系结构
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【胜****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【胜****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。