欢迎来到咨信网! | 成为共赢成为共赢 咨信网助力知识提升 | 自信网络旗下运营:咨信网 自信AI创作助手 自信AI导航
咨信网
全部分类
  • 包罗万象   教育专区 >
  • 品牌综合   考试专区 >
  • 管理财经   行业资料 >
  • 环境建筑   通信科技 >
  • 法律文献   文学艺术 >
  • 学术论文   百科休闲 >
  • 应用文书   研究报告 >
  • ImageVerifierCode 换一换
    首页 咨信网 > 资源分类 > PDF文档下载
    分享到微信 分享到微博 分享到QQ空间

    高性能计算系统性能评价白皮书.pdf

    • 资源ID:1318073       资源大小:15.16MB        全文页数:32页
    • 资源格式: PDF        下载积分:20金币
    微信登录下载
    验证码下载 游客一键下载
    账号登录下载
    三方登录下载: QQ登录
    二维码
    微信扫一扫登录
    下载资源需要20金币
    邮箱/手机:
    验证码: 获取验证码
    温馨提示:
    支付成功后,系统会自动生成账号(用户名为邮箱或者手机号,密码是验证码),方便下次登录下载和查询订单;
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    开通VIP
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    声明    |    会员权益      获赠5币      写作写作
    1、填表:    下载求助     索取发票    退款申请
    2、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
    3、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
    4、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
    5、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【Stan****Shan】。
    6、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
    7、文档遇到问题,请及时私信或留言给本站上传会员【Stan****Shan】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。

    高性能计算系统性能评价白皮书.pdf

    1、白皮书以高性能计算系统综合评价指标作为评估系统性能的新方法,牵引建设存算平衡、以数据为中心的系统,以达到三个主要目标:以实际需求牵引系统设计,以行业经验为指导系统选型,以提高系统实际使用能效为首要目标。白皮书将以综合评价指标为载体,介绍高性能计算系统设计方法,提升高性能计算系统设计选型的平衡性。白皮书从算力(包括科学计算与AI计算性能)、存力(存储性能)、运力(网络性能)和效率(系统能效与平衡性)六个维度选取指标,给出了综合性能的评测方法,和高性能计算系统的典型应用场景、典型系统配置,最后提出了建立评测社区推广评测体系的愿景,展望了标准演进的规划。白皮书内容将随着技术演化与社区成员反馈而逐步迭

    2、代,这是系统性能评价指标发布的首个版本。主要理念白皮书内容目 录目 录CONTENTSCONTENTS1.1.存储系统的重要性愈发凸显0302050711041.2.系统综合性能更突出2.1.性能评价方法的演进趋势053.1.性能评价基准测试程序07103.2.性能评价的标准规范4.1.六个维度度量高性能计算系统12124.1.1.科学计算性能维度124.1.2.AI计算性能维度124.1.3.存储性能维度134.1.4.网络性能维度134.1.5.系统能效维度134.1.6.系统平衡性维度164.2.综合评价计算方法164.3.指标权重与平衡性范围的设计初稿2.2.以性能评价牵引05建设存算

    3、比合理的计算系统2.3.以性能评价牵引06使用多协议互通的存储系统1高性能计算的发展趋势3高性能计算性能评价现状4高性能计算性能指标和评价规范2集群综合性能评价方法的演进19275.1.典型算力下的集群设计示例195.1.1 超大型集群设计示例205.1.2 大型集群设计示例215.1.3 中型集群设计示例225.2.典型场景下的集群特性分析 235.2.1.“IO密集型”超算系统:以面向基因测序的集群为例235.2.2.“IO密集+计算密集型”超算系统:以面向气象预报的集群为例245.2.3.“AI密集型”超算系统:以面向自动驾驶的集群为例255性能评价方法的应用6高性能计算系统性能评价规范

    4、的展望01党的十九届四中全会首次将数据作为生产要素参与分配,数据的作用受到国家高度重视,2022年1月,国务院“十四五”数字经济发展规划中要求“以数据为关键要素,加强数字基础设施建设”,数据资源汇聚、共享、流通、应用的需求快速增加,对存储、计算、网络、安全等的要求也越来越高,以数据为中心的新型数字基础设施将有力支撑经济社会数字化发展。2021年5月,国家发展改革委会同中央网信办、工业和信息化部、国家能源局联合发布全国一体化大数据中心协同创新体系算力枢纽实施方案,提出构建数据中心、云计算、大数据一体化的新型算力网络体系,布局建设全国一体化算力网络国家枢纽节点,以满足数据资源存储、计算和应用需求的

    5、大幅提升。在需求和政策双重牵引下,全国各地区大力推进数字基础设施建设的发展,包括计算、存储和网络在内的基础设施和技术均被高度重视,2022年7月,工业和信息化部主办的中国算力大会上发布了中国综合算力指数,从算力、存力、运力、环境四个维度综合评价新型基础设施和新型数据中心的发展水平。高性能计算的发展趋势102高性能计算是重要的数字基础设施、国之重器,是高算力、高存力、高运力的代表。2020年以来,十四五信息化规划和新基建驱动我国高性能计算建设进入高速增长期,多地地方政府和企事业单位都在积极建设高性能计算中心和部署新一代高性能计算系统,将其作为推动经济社会快速发展的关键措施。随着数据价值的不断提升

    6、以及大数据、人工智能等新兴数字产业的兴起,高性能计算正在由“大计算”的HPC加速迈向“大计算”+“大数据”的HPDA(高性能数据分析),并呈现5大趋势特点。多元应用驱动多元算力。CPU处理器和GPU、FPGA、xPU等专用处理器相结合构建高性能计算的异构算力体系结构。AI计算发展迅猛。AI计算成为高性能计算算力发展最为迅猛的类型之一,且逐步呈现计算芯片DSA化、计算网络多平面化等特征。成为与传统高性能计算越来越有区分的领域,这种变化与特征在大模型时代表现的更为明显。异构多态复合归一,资源集约推动架构融合化。一方面,根据应用的需求,构建不同性能和功能的计算和存储环境,通过灵活组织异构计算体系结构

    7、,实现计算、存储资源比例的灵活调整和性能功耗的平衡。另一方面,围绕应用负载特征开展体系结构软硬件协同设计,提升资源的使用效率与性能。高速互联,更宽更快推动全光化。当前高性能计算互联网络主要有Infiniband、Slingshot和RoCE等,随着技术积累和产业需求升温,光子集成技术已从功能器件研究向规模化集成芯片演进,光交换技术趋于成熟,全光交换成为发展趋势。按需弹性极简运维,加速应用容器化。容器可以为高性能计算工作负载提供动力,并为大规模计算工作负载启用若干功能框架,能够提前封装高性能计算运行环境,易获取、易操作、易利用,在科研人员中普及化使用高性能计算。以数据为中心,数据密集型超算快速发

    8、展。进入大数据时代后,数据的规模不断增长。随着HPDA的发展,高性能计算系统的业务负载需考虑HPC、大数据和AI的混合叠加,对于数据的存储和处理能力提出了更高要求。高性能计算系统需要从数据密集型角度进行设计,支持应用驱动的科学计算工作流,推动负载从计算科学发现向数据科学发现转变。总结以上趋势,不难看出,当前计算性能已不再是评价高性能计算集群的唯一标准,集群的综合性能日益受到重视,尤其是与数据息息相关的存储系统。1.1.存储系统的重要性愈发凸显传统的高性能计算行业以算力作为核心生产力,如今,业界普遍意识到,当数据存力不足或者效率低下时,数据就无法高效流动、按需使用,也就无法充分挖掘其价值,小则影

    9、响算力作用的充分发挥,大则关乎整个高性能计算产业的发展。存储性能是继计算性能之后,各行各业数字化能力建设的一种进阶,在数字经济发展中至关重要。存储与计算性能高度融合,方能真正形成新的核心生产力,能够在各种业务场景中让效率指数级增加,让生产力获得前所未有的解放。平衡存算比是当前超算集群融合存储与计算性能的主要方法之一。目前,芯片不断朝着高性能、低成本、高集成的方向发展,但随着单芯片集成的晶体管数量增多,高耗能等问题随之出现,导致芯片性能难以持续提升,无法大规模提升算力。多芯片堆叠封装为芯片突破性能瓶颈提供了可能,平衡存算比可有效缩短数据搬运路径,降低搬运功耗,实现芯片级算力与IO的平衡。从设备内

    10、视角来看,CPU、总线速度、主内存带宽及容量的发展速度不一,尤其是在处理海量数据过程中,内存与存储的空间和带宽成为制约性能增长的主要瓶颈,如果存储设备能平衡CPU和IO性能,将在很大程度上释放算力潜力。此外,随着数据量的增加,数据处理和存储的效率也需要及时跟进。在多样化的HPC场景中,日均产生的数据量可达PB级,需要超大的容量方能完成归档。除此之外,在海量数据处理过程中,数据可能需要经过多种格式的转换,比如自动驾驶和石油勘探这两个高性能计算应用较为普遍的领域,只有将NFS格式的数据转换成HDFS格式后,系统才能进行有效处理。海量的数据转换需要耗费大量的时间,其中还会损坏部分数据,而且产生的数据

    11、冗余也占用了宝贵的存储空间。因此,存储设备实现多协议互访可有效提升数据结构多样化的处理效率。031.2.系统综合性能更突出随着社会经济的发展和科学的进步,爆炸式增长的应用需求不断促进高性能计算往更广、更深的领域进行系统性扩展。量子化学、基因测序、气象预测和核技术等传统的高性能计算领域需要并行处理大量的原始数据。因此,除了需要保证密集计算的能力以外,海量数据并发执行、极高的数据并发存取效率也对集群的存储性能提出了较高的挑战。在这种条件下,只有保证系统聚合能力随节点数线性扩展、保证流畅的并行I/O与高带宽的网络才能获得复合性的计算能力,满足日益复杂的计算需求。除此之外,高性能计算在非传统的应用领域

    12、中也发挥着独特的作用,例如金融、投行和保险业所承担的风险分析工作,除了发挥传统高性能计算的密集计算性能外,集群更多融入了数据处理、事务处理和信息服务的功能。在这些场景下,科学计算能力的主导地位有所弱化,相反,网络和存储提供的实时数据处理和快速交付功能更为凸显。当代高性能计算的发展,能耗和功耗也扮演着越来越重要的角色,逐渐成为成为大规模计算平台建设必须考虑的重要因素,绿色节能也成为衡量高性能计算平台综合性能的重要尺度,TOP500和Green500排名榜单均加入能耗指标。近来,最新一代的E级超算系统的设计能耗标准是不超过20MW。诚然,硬件工艺的更新换代对能耗的降低至关重要,但要想让高性能计算系

    13、统以最大性能、最高能耗效率运行,也需要让存储、网络、计算等各个组件基于应用特征无缝衔接,否则很有可能成为整个集群性能的掣肘。因此,当代高性能计算的发展趋势更倾向于整体的综合性能。042.1.性能评价方法的演进趋势现有的性能评价规范专注细分领域,存在重计算、轻存储、评测指标分散、缺少应用场景和缺少综合的性能评价规范等缺点。这些评测规范通常过分强调被测系统某一个方面的能力,容易造成偏科。例如,在设计系统时若以浮点计算能力为唯一考量目标,以此为指导设计出的高性能计算系统,难以全面满足高算力、高存力、高运力、高能效的新型基础设施要求。此外,现有评价方法对新场景的关注还不够。随着NVMe全闪存储介质、基

    14、于纠删码的存储冗余机制、多协议互通存储系统、新一代异构加速处理器的面市,诞生了诸如BurstBuffer闪存缓冲文件系统、超高密度存储系统、多功能一体化存储系统、面向超大模型训练的人工智能专用系统等新的集群应用场景。如何为这些场景分类,如何评价设计系统与这些场景的适用程度,是新的性能评价方法需要解决的问题。2集群综合性能评价方法的演进设计高效工作的高性能计算集群系统,需要在目标场景指引下,平衡处理器、网络和存储等组件的选型,合理搭配。高性能计算集群的综合性能评测方法能够发挥“标尺”作用,对衡量设计的有效性产生着重要作用。05062.2.以性能评价牵引建设存算比合理的计算系统下图展示了存储的层次

    15、化结构。从数据使用的时间视角看,数据在不同的存储层次停留,等待被上一层调用,或者是被换出到下一层。在有限的预算下,如何设计各个层次的存储容量和存储带宽,是一个相当重要却容易被忽视的问题。论文An analysis of system balance and architectural trends based on top500 supercomputers总结今年Top500超算集群配置,提出了各层次存储容量和速率比例的参考范围。我们提出的评测方法在“系统效率”部分参考这篇论文的研究结果,以此来引导设计集群存储系统的容量和带宽。2.3.以性能评价牵引使用多协议互通的存储系统从数据使用的角色视

    16、角看,数据在计算系统中需要经过仿真生成、大数据分析、对外发布的流程。这些流程会分别调用MPI多机并行软件、大数据分析软件和Web数据共享软件,而这些软件性能最佳的数据访问接口可能是不一样的。例如,仿真阶阶段需要调用MPI-IO接口,大数据阶段需要调用HDFS,而分享阶段需要调用S3接口。传统存储系统在多用途场景下,需要用户将一份数据拷贝多次,手动维护不同接口数据的一致性。而新型存储系统内置协议互通功能,能够无缝地为同一份数据提供多种数据访问接口,并维护其一致性。我们的评测方法也增加了多协议互通的相关内容,以此引导超算集群的多协议互通建设。我们提出的性能评价标准,旨在引入与使用场景相关的性能指标

    17、,通过综合评分方法,为集群的计算、存储、网络和效率这四个关键维度,分别给出评价分数,并结合专家意见,给出系统建设的进一步建议。与现有评测标准较大的区别是,这个标准将从数据使用的时间和角色的视角,着力牵引建设存算比更加合理的计算系统,以及建设具有多协议互通功能的存储系统。DROS(分布式关系型对象服务层)Index LayerPersistence Layer元数据/数据管理层高级特性语义抽象层管控面NFSCIFSMPIPOSIXS3HDFS现有高性能计算评价标准呈现出“缺少行标国标、评测程序分散、评测领域单一”的问题。本节介绍超算集群性能评价基准测试与标准的现状。3.1.性能评价基准测试程序当

    18、前,业内研究人员发布了数十个具有不同侧重面的高性能计算集群性能基准测试程序,按照评价的领域,可以分为基础计算性能、图计算性能、AI计算性能、存储网络性能、设备能效等等。各个主要领域中相对知名的基准测试程序如下表所示:3高性能计算性能评价现状07评测领域基础计算性能TOP500、HPCG、PARSEC、SPECCPU、SPECHPC、SPECACCEL图计算性能Graph500知名基准测试程序08其中,被广泛使用的包括Linpack(求解线性方程组性能)、HPCG(求解共轭梯度性能)、IO500(存储性能)、Graph500(图计算性能)、AI500(AI计算性能)等,但是均专注于各个细分的评测

    19、领域,缺少对集群的综合性能评测,且多数没有形成系统性的评价规范。始于1993年的TOP500榜单是目前最为熟知的高性能计算性能评价规范,由国际组织“TOP500”编制,每半年发布一次,TOP500排名基于Linpack基准测试衡量线性方程计算的速度和效率,最新版HPL2.0规范从2008年一直用到现在,不过随着越来越多的应用程序采用微分方程等复杂计算方式,Linpack性能与实际计算效率间的差距将越来越大。因此田纳西大学教授Jack Dongarra提出了HPCG(高度共轭梯度基准测试)标准,与Linpack关注线性方程的计算性能不同,HPCG使用更复杂的微分方程计算方式。Linpack更考验

    20、超算的处理器理论性能,而HPCG更看重实际性能,对内存系统、网络延迟要求也更高。除了TOP500以外,多个评测榜单试图从不同方向对超算集群的性能展开评价:面向图计算性能的Graph 500标准于2010年发布,采用GTEPS基准测试评价,更加适用于在数据密集型应用场景中的评测;BenchCouncil的AI500测试标准,基于增量迭代的方法学和智能科学计算应用场景,目前包含3个典型科学数据集,14个负载的不同软件栈实现;IO500是衡量高性能计算存储性能的常用评价标准,于2017年11月发布,该标准涵盖带宽和元数据两项基准测试。同时,业界还存在多个商用或非商用的评测基准套件,例如侧重计算性能的

    21、SPEC系列和PERSEC、侧重AI应用性能的MLPerf、侧重存储与网络性能的OSU Microbenchmarks和HPC Challenge等。以下是SPEC HPC与HPC Challenge两个被广泛应用的基准测试套件的测试内容:SPEC HPC包含9个测试,涵盖了宇宙学、天气学、高能物理学等多个方向的科学计算问题,侧重于科学计算性能的测试。SPEC HPC的评分规则相对简单,使用了基准集群的运行时间与被测集群的运行时间的比值作为集群的评分。评测领域AI计算性能HPC AI500、MLPerf、AIPerf、AISBench存储与网络性能IO500、OSUMicrobenchmark

    22、sHPCChallenge设备能效Green500知名基准测试程序09基准测试评测领域HPL:测量求解线性方程组的浮点执行率计算性能存储性能网络性能DGEMM:测量双精度实矩阵-矩阵乘法的浮点执行率FFT:测量双精度复数一维离散傅里叶变换(DFT)的浮点执行率PTRANS(并行矩阵转置):来自多处理器内存的大型数据数组的传输速率,测试网络总通信容量RandomAccess:测量内存的整数随机更新率STREAM:测量可持续内存带宽和简单矢量内核的相应计算速率通信带宽:测量传输大小为2,000,000字节消息所需的时间HPC Challenge包含了8个测试,分别属于科学计算性能、存储性能与网络性

    23、能三个评测领域。然而,该基准测试未提供综合评价的计算规范,仅对于各个测试分别输出了性能的数值。LBM D2Q37:计算流体动力学Tealeaf:物理学/高能物理学Cloverleaf:物理学/高能物理学Minisweep:核工程-辐射传输POT3D:太阳物理学SPH-EXA:天体物理学和宇宙学HPGMG-FV:宇宙学、天体物理学、燃烧miniWeather:天气基准测试评测领域通信延迟:测量将8字节消息从一个节点发送到另一个节点所需的时间SOMA Offers Monte-Carlo Acceleration:物理/聚合物系统科学计算性能10其中,数据中心存储能效测评规范规定了数据中心存储设备

    24、的能效测试方法与能效等级评价方法,对测试环境、测试方法、能效指标、加分项均做出了规范;分布式块存储总体技术要求针对分布式块存储解决方案提出功能、性能、可靠性等方面的要求;计算存储分离架构的分布式存储测试方法规定了计算存储分离架构的分布式存储方案的功能、性能、兼容性、扩展性、可靠性、安全性、运维、硬件和网络测试方法;服务器应用场景性能测试方法 高性能计算通过制定标准化的评估方法,对比评估绿色计算产品与传统架构产品在该场景所关注指标、特性上的差异化优势,展示了以ARM架构为代表的绿色计算服务器在高性能计算应用场景的性能表现。3.2.性能评价的标准规范现有的高性能计算性能评价规范非常碎片化。国内外标

    25、准化组织尚未发布针对高性能计算集群综合性能评价的国家或行业标准,现有标准集中于数据中心和存储,缺少集群性能相关的国标、行标、ISO标。相关的标准主要有如下几项:标准号标准名称发布时间类型T/CCSA 325-2021数据中心存储能效测评规范2021/11/2团标T/CCSA 263-2019分布式块存储总体技术要求2019/12/23团标YD/T 4030-2022计算存储分离架构的分布式存储测试方法2022/4/8行标GCC7003-2020服务器应用场景性能测试方法 高性能计算2020/11/26地标T/CESA 1213-2022通用计算CPU性能测试评价技术要求2022/7团标T/CE

    26、SA 1214-2022分布式块存储总体技术要求2022/7团标T/CESA 1215-2022计算存储分离架构的分布式存储测试方法2022/7团标T/CESA 1169-2021信息技术 人工智能 服务器系统性能测试规范2021/9地标IEEE P2937Performance Benchmarking for ArtificialIntelligence Server Systems2022/9地标为了弥补现存基准测试和标准在指标设置与评价规范方面的不足,确保本文所设置的高性能计算系统性能评价指标具有科学性和可解释性,我们充分调研了Top500各大超级计算集群的性能指标,相应数据集的链接为

    27、https:/ R-CNN模型。图像推理任务的计算性能:系统使用ResNet-50模型在图像推理任务的性能,单位:VFLOPS。测试数据集使用ImageNet,遍历周期(Epochs)设定为90,性能度量单位VFLOPS计算方法如下:FLOPS*(实测准确度/目标准确度)5,其中,FLOPS是推理过程中的浮点运算速度,实测准确度是测试过程实际达到的Top1准确度;目标准确度是测试标准预定义的最佳模型质量Top1,设定为0.763。图像训练任务的计算性能:系统使用Mask R-CNN模型在COCO数据集上的图像训练任务中的训练速度,单位:图片/秒。质量要求为每AP0.377Box和0.339Ma

    28、sk,性能度量单位为完成质量要求的训练所花费的时间。4.1.3.存储性能维度本维度共包含以下5个指标,参考了在IO500等榜单中被广泛使用的测试基准,同时扩展了存储新能力(多协议互通)的测试,衡量高性能计算集群存储系统的性能特征。运行测试程序,获得6个维度共19项基础指标浮点计算性能(Flops)存储带宽(GB/s)网络延迟(微秒).19项基础指标1为19项指标设计维度内权重浮点计算性能存储带宽网络延迟.19项指标权重2使用几何平均数计算每个维度的性能评分维度1:科学计算性能维度2:AI计算性能维度3:存储性能维度4:网络性能维度5:系统能效维度6:系统平衡性3分析集群特点,给出特定场景下的提

    29、升建议提升建议4存储性能网络性能能效AI计算通用计算6868727892+13文件系统单客户端单流带宽:文件系统在单客户端单流测试条件下能达到的带宽,单位GB/s。文件系统单客户端多流带宽:文件系统在单客户端多流测试条件下能达到的带宽,单位GB/s。文件系统聚合带宽:文件系统在多客户端多流测试条件下能达到的聚合带宽,单位GB/s,按照文件系统可用容量划分评价等级。文件系统聚合IO操作速率:文件系统在多客户端多流测试条件下能达到的IO操作速率,单位:IOPS,按照文件系统可用容量划分评价等级。多协议平均访问效率:分别以HDFS、对象、NFS三种协议访问文件系统上的同一份数据时,与使用POSIX标

    30、准文件访问协议的速率比值,取三项比值的平均数,不支持的协议比值为0,单位为百分比。4.1.4.网络性能维度本维度共包含以下3个指标,以描述高性能计算集群的网络性能。随着集群规模的扩大、精度要求的提高、模型趋于复杂,以及数据中心、云计算、异地超算等分布式基础设施的概念提出,集群对IO通信性能的需求迅速增加。网络通信也成为了评价集群性能的一个不可或缺的维度,与存力一同保障了算力的高效率运行。点对点通信带宽:系统中任意两个节点间的双向通信带宽,单位Gbps。点对点通信延迟:系统中任意两个节点间的通信往返延迟,单位微秒。网络对分带宽与注入带宽比值:系统网络的对分带宽与所有节点注入带宽的比值,单位为比值

    31、。4.1.5.系统能效维度本维度包含2个指标,用于评价高性能计算集群的能源利用效率。随着高性能计算集群算力突破E级大关,以及数据量的爆炸性增长,高能耗将成为未来集群的核心挑战。提升算力与存力的能源利用效率势在必行。单位功耗支持浮点计算能力:系统的HPL浮点计算性能计算子系统能耗的比值,计算单位功耗下的浮点计算能力,单位FLOPS/W。单位功耗的可得存储容量:系统的可得存储容量与存储子系统额定功率的比值,计算单位功耗下的可得存储容量,单位TB/W。4.1.6.系统平衡性维度本维度共包含5个指标,用于评价高性能计算系统的容量层级。内存容量与核心数比:内存容量与处理器核心数的比值,单位为比值。Bur

    32、stBuffer与内容容量比:BurstBuffer容量与内存容量的比值,单位为比值。长久存储与BurstBuffer容量比:并行文件系统容量与BurstBuffer容量的比值,单位为比值。内存与BurstBuffer的带宽比:内存带宽与BurstBurffer带宽的比值,单位为比值。BurstBuffer与文件系统的带宽比:BurstBuffer带宽与并行文件系统带宽的比值,单位为比值。14匹配度=(1)V上限V下限V上限+V下限V V表 高性能计算性能指标汇总表实际测试值PFLOPS维度指标数值说明备注单位科学计算性能AI计算性能存储性能系统使用双精度共轭梯度法求解稀疏线性方程组时的浮点运

    33、算速度。系统使用双精度高斯消元法求解稠密线性方程组时的浮点运算速度。图像推理任务的计算性能HPCG双精度浮点计算性能HPL双精度浮点计算性能图像训练任务的计算性能文件系统单客户端单流带宽文件系统单客户端多流带宽实际测试值实际测试值实际测试值实际测试值图片/秒GB/sGB/sVFLOPS系统使用ResNet-50模型在图像推理任务的性能。测试数据集使用ImageNet,遍历周期(Epochs)设定为9 0,性 能 度 量 单 位VFLOPS计算方法如下:FLOPS*(实测准确度/目标准确度)5。系统使用Mask R-CNN模型在COCO数据集上的图像训练任务中的训练速度。文件系统在单客户端单流测

    34、试条件下能达到的带宽。文件系统在单客户端多流测试条件下能达到的带宽。文件系统聚合带宽文件系统聚合IO操作速率实际测试值实际测试值GB/sIOPS文件系统在多客户端多流测试条件下能达到的聚合带宽。文件系统在多客户端多流测试条件下能达到的IO操作速率。上述5个指标值需经转换后才能有效使用,转换方式如公式(1)所示。当指标值在上下限范围内时,取值为1,表示匹配度较高,即该值越优;当取值在上下限范围外时,该值小于1。匹配度越高时,该值设计的就越好。TFLOPS实际测试值15维度指标数值说明备注单位存储性能网络性能多协议平均访问效率点对点消息延迟网络对分带宽与注入带宽比值单位功耗的浮点计算性能实际测试值

    35、实际测试值理论计算值实际测试值系统能效百分比微秒百分比GFLOPS/W分别以HDFS、对象、NFS三种协议访问文件系统上的同一份数据时,与使用POSIX标准文件访问协议的速率比值的平均值。系统中任意两个节点间的MPI消息通信往返延迟。计算网络性能时,该指标取延迟数值的倒数。点对点网络带宽实际测试值Gbps系统中任意两个节点间的MPI消息通信双向带宽系统网络的对分带宽与所有节点注入带宽的比值。系统的浮点计算实测性能与计算子系统能耗的比值。单位功耗的可得存储容量系统的可得存储容量与存储子系统额定功耗的比值。实际测试值TB/W系统平衡性内存容量(GB)与处理器核心数的比值评分时如下公式转换为“匹配度

    36、”再代入综合评价分数计算匹配度。理论计算值比值BurstBuffer容量与内存容量的比值理论计算值理论计算值比值比值长久存储容量与BurstBuffer容量的比值16维度指标数值说明备注单位4.2.综合评价计算方法本评价规范使用几何平均数计算每个维度的性能评分,为每个被测集群评出科学计算性能、AI计算性能、存储性能、网络性能、系统能效和系统平衡性六个维度的评分。维度 的性能评分按照公式(2)计算。其中,为维度的性能指标集合,为指标 在被测超算集群上的性能。为不同测试指标的权重。为调整系数,建议该常数值为100。考虑到不同计算集群的算力规模,使用公式(2)对各个维度进行评分之前,需要参考表2中的

    37、HPL实测性能对集群进行划档分类,然后再进行评分。对高性能计算集群的评价,最终会输出两个结果:(1)评测数据详表:该表详细记录各指标性能的数值;(2)性能雷达图:以多维度雷达图来显示集群系统在不同维度的性能评分。内存带宽与BurstBuffer带宽的比值实际计算值比值比值BurstBuffer带宽与并行文件系统带宽的比值实际计算值系统平衡性评分时如下公式转换为“匹配度”再代入综合评价分数计算匹配度。4.3.指标权重与平衡性范围的设计初稿我们根据经验初步设计了如下的指标权重,主要考虑是:在计算性能维度,以HPL为代表的稠密矩阵计算方法应用最广泛,权重最高。存储性能维度的五个指标重要性相当,均分1

    38、.0权重。网络性能维度中,点对点带宽最重要因此权重最高。系统能效方面,单位功耗浮点性能比可用存储容量重要,因此权重更高。系统平衡性方面,五个指标重要性相当,均分1.0权重。综合评价方法的使用者可以针对具体测试场景,按需设置权重。17表 指标权重维度指标权重科学计算性能AI计算性能HPL双精度浮点计算性能0.6HPCG双精度浮点计算性能0.4图像推理任务的计算性能0.5图像训练任务的计算性能0.5存储性能文件系统单客户端单流带宽0.2文件系统单客户端多流带宽0.2文件系统聚合带宽0.2文件系统聚合IO操作速率0.2多协议平均访问效率0.2点对点网络带宽0.4网络性能点对点消息延迟0.3网络对分带

    39、宽与注入带宽比值0.3单位功耗的浮点计算性能0.6系统能效单位功耗的可得存储容量0.4内存容量(GB)与处理器核心数的比值0.2BurstBuffer容量与内存容量的比值0.2长久存储容量与BurstBuffer容量的比值0.2内存带宽与BurstBuffer带宽的比值0.2系统平衡性BurstBuffer带宽与并行文件系统带宽的比值0.218我们调研了历年Top500超算集群,在现有集群建设经验基础上,初步整理了各层级存储系统容量、带宽的配比范围。按照集群实测峰值计算能力,我们将集群划分为三档规模,分别是:性能大于30PFLOPS的超大型集群,性能10-30PFLOPS的大型集群,和1-10

    40、PFLOPS的小型集群。不同规模的集群具有不同的设计考量,因此在平衡性上有范围差异。后续将补充其他评估方法,不断完善建议值范围。指标按实测峰值计算能力分类内存容量(GB)与处理器核心数的比值BurstBuffer容量与内存容量的比值并行文件系统存储容量与BurstBuffer容量的比值内存带宽与BurstBuffer带宽的比值建议值范围61028134625142040103022015005000100030008002000482614BurstBuffer带宽与并行文件系统带宽的比值30PFLOPS10-30PFLOPS1-10PFLOPS30PFLOPS10-30PFLOPS1-10P

    41、FLOPS30PFLOPS10-30PFLOPS1-10PFLOPS30PFLOPS10-30PFLOPS1-10PFLOPS30PFLOPS10-30PFLOPS1-10PFLOPS5.1.典型算力下的集群设计示例我们调研TOP500超算集群的相关性能,基于集群实测性能,将集群划分为三档:30PFLOPS以上、10-30PFLOPS、1-10PFLOPS,分别对应超大型计算集群、大型计算集群和中型计算集群。在2022年Top500榜单上,这三类集群的数据量分别占约20台、35台和445台。白皮书提出的性能评价方法主要有两个应用:1)指导典型算力下的集群设计,即在给定算力下,如何设计和选择其他

    42、组件的性能。2)分析典型场景下的集群特性,将集群划分为“计算密集”、“IO密集”、“计算+IO密集”、“AI计算密集”等类型。下面两节通过例子,展示评价方法在分析不同算力下的集群设计、超算集群类型划分中的作用。5性能评价方法的应用19205.1.1 超大型集群设计示例Summit超级计算机坐落于美国橡树岭国家实验室,它从一开始就专为人工智能操作而设计,可以使用机器学习和深度学习来推动在健康、物理和气候建模以及其他领域的研究。除此之外,Summit的设计非常灵活,能够有效平衡各种科学和工程类计算的工作负载。使用上文所述的评分方法,Summit超级计算各维度的指标和各维度的评分结果如下所示,不同维

    43、度内的各指标所占权重见附录表格。部分性能指标结果难以获得,我们通过推测得出。维度指标评分AI计算性能图像推理任务的计算性能(单位:VFLOPS)3070000000图像训练任务的计算性能(单位:图片/秒)存储性能文件系统单客户端单流带宽(单位:GB/s)35718文件系统单客户端多流带宽(单位:GB/s)文件系统聚合带宽(单位:GB/s)文件系统聚合IO操作速率(单位:IOPS)多协议平均访问效率(单位:百分比)点对点网络带宽(单位:Gbps)704网络性能点对点消息延迟(单位:微秒)网络对分带宽与注入带宽比值单位功耗的浮点计算性能(单位:GFLOPS/W)114系统能效单位功耗的可得存储容量

    44、(单位:TB/W)内存容量(GB)与处理器核心数的比值BurstBuffer容量与内存容量的比值长久存储容量与BurstBuffer容量的比值内存与BurstBuffer的带宽比值系统平衡性BurstBuffer与文件系统带宽的比值90数值26198484(*)35942400(*)科学计算性能HPL双精度浮点计算性能(单位:PFLOPS)47578HPCG双精度浮点计算性能(单位:TFLOPS)148.62725.758132500260000000.862000.561.02214.7190.02481(+)0.68(+)0.89(+)0.95(+)1(+)注:(+)表示匹配后的值,(*)

    45、表示该项指标结果为估计值215.1.2 大型集群设计示例“Hawk”超级计算机坐落于德国斯图加特大学,该型超级计算机主要服务于在能源、气候、尖端学术、工业和健康等领域的研究,在发电厂的优化、区域和全球气候模型的相互作用、流行病和迁徙的探索、车辆和飞机的空气动力学改进以及噪音排放的测定等领域均发挥着重要的作用。使用上文所述的评分方法,“Hawk”超级计算各维度的指标和各维度的评分结果如下所示,不同维度内的各指标所占权重见附录表格。部分性能指标结果难以获得,我们通过推测得出。维度指标评分AI计算性能图像推理任务的计算性能(单位:VFLOPS)26743581图像训练任务的计算性能(单位:图片/秒)

    46、存储性能文件系统单客户端单流带宽(单位:GB/s)30406文件系统单客户端多流带宽(单位:GB/s)文件系统聚合带宽(单位:GB/s)文件系统聚合IO操作速率(单位:IOPS)多协议平均访问效率(单位:百分比)点对点网络带宽(单位:Gbps)671网络性能点对点消息延迟(单位:微秒)网络对分带宽与注入带宽比值单位功耗的浮点计算性能(单位:GFLOPS/W)35系统能效单位功耗的可得存储容量(单位:TB/W)内存容量(GB)与处理器核心数的比值BurstBuffer容量与内存容量的比值长久存储容量与BurstBuffer容量的比值内存与BurstBuffer的带宽比值系统平衡性BurstBuf

    47、fer与文件系统带宽的比值注:(+)表示匹配后的值,(*)表示该项指标结果为估计值80数值240329(*)297600(*)科学计算性能HPL双精度浮点计算性能(单位:PFLOPS)6047HPCG双精度浮点计算性能(单位:TFLOPS)19.33334.659(*)11(*)1760(*)18190000(*)0.82(*)2000.60.81(*)4.950.00641(+)0.53(+)1(+)1(+)(*)0.9(+)(*)225.1.3 中型集群设计示例“Wilkes-3”坐落于英国剑桥大学,是世界上第一台云原生超级计算机,该超算中心为英国的科学研究提供了主要的计算资源,在天体物理

    48、学、材料模拟、核聚变发电和临床医学研究具有重要的应用。使用上文所述的评分方法,“Wilkes-3”超级计算各维度的指标和各维度的评分结果如下所示,不同维度内的各指标所占权重见附录表格。部分性能指标结果难以获得,我们通过推测得出。注:(+)表示匹配后的值,(*)表示该项指标结果为估计值维度指标评分AI计算性能图像推理任务的计算性能(单位:VFLOPS)45039380图像训练任务的计算性能(单位:图片/秒)存储性能文件系统单客户端单流带宽(单位:GB/s)30389文件系统单客户端多流带宽(单位:GB/s)文件系统聚合带宽(单位:GB/s)文件系统聚合IO操作速率(单位:IOPS)多协议平均访问

    49、效率(单位:百分比)点对点网络带宽(单位:Gbps)691网络性能点对点消息延迟(单位:微秒)网络对分带宽与注入带宽比值单位功耗的浮点计算性能(单位:GFLOPS/W)146系统能效单位功耗的可得存储容量(单位:TB/W)内存容量(GB)与处理器核心数的比值BurstBuffer容量与内存容量的比值长久存储容量与BurstBuffer容量的比值内存与BurstBuffer的带宽比值系统平衡性BurstBuffer与文件系统带宽的比值99数值408981(*)496000(*)科学计算性能HPL双精度浮点计算性能(单位:PFLOPS)728HPCG双精度浮点计算性能(单位:TFLOPS)2.29

    50、41.22(*)10(*)15(*)1500(*)13240000(*)0.87(*)2000.59(*)0.91(*)29.70.016(*)1(+)1(+)(*)1(+)(*)0.93(+)(*)1(+)(*)235.2.典型场景下的集群特性分析为探索可有效评估高性能计算集群系统的性能指标,本文充分调研了几个典型的高性能计算应用场景,其中包括基因测序、气象预报、油气勘探、自动驾驶和新材料设计领域,研究不同场景下的应用特性和典型,分析不同应用场景下的超算集群需要拥有的性能特点。5.2.1.“IO密集型”超算系统:以面向基因测序的集群为例基因测序作为基因检测的重要方法,可以通过基因组信息以及相


    注意事项

    本文(高性能计算系统性能评价白皮书.pdf)为本站上传会员【Stan****Shan】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4008-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表




    页脚通栏广告
    关于我们 - 网站声明 - 诚招英才 - 文档分销 - 便捷服务 - 联系我们 - 成长足迹

    Copyright ©2010-2024   All Rights Reserved  宁波自信网络信息技术有限公司 版权所有   |  客服电话:4008-655-100    投诉/维权电话:4009-655-100   

    违法和不良信息举报邮箱:help@zixin.com.cn    文档合作和网站合作邮箱:fuwu@zixin.com.cn    意见反馈和侵权处理邮箱:1219186828@qq.com   | 证照中心

    12321jubao.png12321网络举报中心 电话:010-12321  jubao.png中国互联网举报中心 电话:12377   gongan.png浙公网安备33021202000488号  icp.png浙ICP备2021020529号-1 浙B2-20240490   



    关注我们 :gzh.png  weibo.png  LOFTER.png