当前位置：首页 > 并行发展史

并行发展史

62 次阅读
3 次下载
2025/6/15 10:46:15

计算机发展

]从20世纪40年代开始的现代计算机发展历程可以分为两个明显的发展时代：串行计算时代、并行计算时代。每一个计算时代都从体系结构发展开始，接着是系统软件（特别是编译器与操作系统）、应用软件，最后随着问题求解环境的发展而达到顶峰。 ????并行计算机是由一组处理单元组成的。这组处理单元通过相互之间的通信与协作，以更快的速度共同完成一项大规模的计算任务。因此，并行计算机的两个最主要的组成部分是计算节点和节点间的通信与协作机制。并行计算机体系结构的发展也主要体现在计算节点性能的提高以及节点间通信技术的改进两方面。 ????节点性能不断进步 ????20世纪60年代初期，由于晶体管以及磁芯存储器的出现，处理单元变得越来越小，存储器也更加小巧和廉价。这些技术发展的结果导致了并行计算机的出现。这一时期的并行计算机多是规模不大的共享存储多处理器系统，即所谓大型主机。IBM 360是这一时期的典型代表。 ????到了20世纪60年代末期，同一个处理器开始设置多个功能相同的功能单元，流水线技术也出现了。与单纯提高时钟频率相比，这些并行特性在处理器内部的应用大大提高了并行计算机系统的性能。伊利诺依大学和Burroughs公司此时开始实施Illiac Ⅳ计划，研制一台64颗CPU的SIMD主机系统，它涉及到硬件技术、体系结构、I/O设备、操作系统、程序设计语言直至应用程序在内的众多研究课题。不过，当一台规模大大缩小的原型系统（仅使用了16颗CPU）终于在1975年面世时，整个计算机界已经发生了巨大变化。 ????首先是存储系统概念的革新，提出虚拟存储和缓存的思想。以IBM 360/85和IBM 360/91为例，两者是属于同一系列的两个机型，IBM 360/91的主频高于IBM 360/85，所选用的内存速度也较快，并且采用了动态调度的指令流水线。但是，IBM 360/85的整体性能却高于IBM 360/91，惟一的原因就是前者采用了缓存技术，而后者则没有。 ????其次是半导体存储器开始代替磁芯存储器。最初，半导体存储器只是在某些机器中被用作缓存，而CDC7600则率先全面采用这种体积更小、速度更快、可以直接寻址的半导体存储器，磁芯存储器从此退出了历史舞台。与此同时，集成电路也出现了，并迅速应用到计算机中。元器件技术的这两大革命性突破，使得Illiac Ⅳ的设计者们在底层硬件以及并行体系结构方面提出的种种改进都大为逊色。 ????处理器高速发展 ????1976年Cray-1问世以后，向量计算机从此牢牢地控制着整个高性能计算机市场15年。Cray-1对所使用的逻辑电路进行了精心的设计，采用了我们如今称为RISC的精简指令集，还引入了向量寄存器，以完成向量运算。这一系列技术手段的使用，使Cray-1的主频达到了80MHz。 ????微处理器随着机器的字长从4位、8位、16位一直增加到32位，其性能也随之显著提高。正是因为看到了微处理器的这种潜力，卡内基·梅隆大学开始在当时流行的DEC PDP-11小型计算机的基础上研制一台由16台PDP-11/40处理机通过交叉开关与16个共享存储器模块相连接而成的共享存储多处理器系统C.mmp。 ????从20世纪80年代开始，微处理器技术一直在高速前进。稍后又出现了非常适合于SMP方式的总线协议。而伯克利加州大学则对总线协议进行了扩展，提出了Cache一致性问题的处理方案。从此，C.mmp开创出的共享存储多处理器之路越走越宽。现在，这种体系结构已经基本上统治了服务器和桌面工作站市场。 ????通信机制稳步前进 ????同一时期，基于消息传递机制的并行计算机也开始不断涌现。20世纪80年代中期，加州理工学院成功地将64个i8086/i8087处理器通过超立方体互连结构连结起来。此后，便先后出现了Intel iPSC系列、INMOS Transputer系列，Intel Paragon以及IBM SP的前身Vulcan等基于消息传递机制的并行计算机。 ????20世纪80年代末到90年代初，共享存储器方式的大规模并行计算机又获得了新的发展。IBM将大量早期RISC微处理器通过蝶形互连网络连结起来。人们开始考虑如何才能在实现共享存储器缓存一致的同时，使系统具有一定的可扩展性。20世纪90年代初期，斯坦福大学提出了DASH计划，它通过维护一个保存有每一缓存块位置信息的目录结构来实现分布式共享存储器的缓存一致性。后来，IEEE在此基础上提出了缓存一致性协议的标准。 ????20世

纪90年代至今，主要的几种体系结构开始走向融合。 ????属于数据并行类型的CM-5除大量采用商品化的微处理器以外，也允许用户层的程序传递一些简单的消息。 ????Cray T3D是一台NUMA结构的共享存储型并行计算机，但是它也提供了全局同步机制、消息队列机制，并采取了一些减少消息传递延迟的技术。 ????随着微处理器商品化、网络设备的发展以及MPI/PVM等并行编程标准的发布，集群架构的并行计算机出现开始。IBM SP2系列集群系统就是其中的典型代表。在这些系统中，各个节点采用的都是标准的商品化计算机，它们之间通过高速网络连接起来。??1.2 有限元并行计算的发展和现状?? 目前，在计算力学领域内，围绕着基于变分原理的有限元法??和基于边界积分方程的边界元法，以及基于现在问世的各种并行??计算机，逐渐形成了一个新的学科分支——有限元并行计算。它??是高效能的，使得许多现在应用串行计算机和串行算法不能解决??或求解不好的大型的、复杂的力学问题能得到满意的解答，故其??发展速度十分惊人。在国际上已经掀起了利用并行机进行工程分??析和研究的高潮。从1975到1995年的二十年间，有关有限元方法??和相应的数值并行计算的文章已发表1000余篇。?? 有限元并行计算正在向两个方向发展。一是对系统方程组实??施并行求解的各种算法。二是并行分析方法，包括有限元并行算??法和边界元并行算法，前者趋向成熟，而后者的研究较少。对这??一方面的研究，是为了挖掘有限元计算自身潜在的并行性，是有??限元并行计算的根本问题。??1.2.1国内?? 并行算法的设计和有效实现强烈地依赖于并行机的硬软件环??境。国内仅极少数单位拥有并行机，且机型杂乱，因此研究人员??少，起步晚，而且局限于特定的硬件环境。从有限元分析方法的??内容来看，发表的几十篇研究论文（报告）还未显示出较强的系??统性。??1）南京航空航天大学周树荃教授等在YH-1向量机上实现了刚度??矩阵计算、对称带状矩阵的Cholesky分解和线性方程组的求解等??并行处理。针对不规则结构工程分析问题，他们还采用了变带宽??存贮方法，并实现了刚度矩阵的并行计算以及求解变带宽稀疏线??性方程组的并行直接解法【20】。??2）中国科学院计算中心王荩贤研究员等在基于Transputer芯片??的分布式MIMD系统上，提出了有限元分析中变带宽线性方程组的??并行直接解法，初步完成了一个静力分析程序【21】。??3）重庆大学张汝清教授等借助于ELXSI-6400共享存贮器型MIMD??系统，先后开展了范围比较广泛的并行算法研究，主要成果有：??a)提出了静力分析中子结构解法的并行算法，以及动力分析中模?? 态综合子结构法的并行算法；??b)从波前法出发，发展了多波前并行算法以求解大型结构分析?? 问题；??c)从Jacobi块迭代法和加权残差法出发，导出了基于异步控制的?? 有限元方程并行解法和有限元并行迭代的基本格式；??d)利用图论中的着色理论，实现了刚度矩阵的并行计算；??e)实现了基于有色线剖分的SOR并行迭代解法；??f)实现了子空间迭代法、Lanczos法以及利用多项式割线迭代法?? 和矢量迭代法求解结构固有频率和模态的并行算法；??g)针对弹塑性分析，提出了一种多波前子结构并行算法；??h)针对弹性接触问题，提出了一种基于参数变分原理的并行解法；??i)实现了一步积分法的并行处理【22】。??4）南京航空航天大学乔新教授等借助于Transputer芯片的分布式??MIMD系统实现了有限元方程组的并行直接解法，并提出了基于子结??构的预处理共轭梯度法的并行计算方法【23】。?? 此外，浙江大学姚坚【24】、中国科学院西南计算中心马寅国、??东北工学院张铁以及国防科技大学六系也曾对有限元分析的并行计??算开展了一些研究。?? 上述研究结果表明，国内并行计算方法的研究，在硬件上基于??向量机、分布式并行机和共享存贮式并行机；在内容上，似乎面很??广，但系统性和深度还很不够，软件开发距实际应用和商品化还有??很大距离，对不依赖并行机具体环境的通用并行算法研究还很少，??同样对旨在进行结构有限元分析的并行计算的硬件研究也很少。??1.2.2国外?? 自从美国国家宇航局（NASA）的A.K.Noor于1975年发表第一篇??有限元并行计算的文章以来，有限元并行处理技术几乎与并行计算??机同步发展。距不完全统计，到1992年，国外已发表了400余篇这方??面的论文，其中后5年的文章篇数是前12年的总和。在研究内容

上也??由过去的算法研究发展到了算法、软件和硬件相结合的研究，并针对??一些机型开发了一些实用的大型结构分析软件。??1）有限元机器FEM【25】（Finite Element Machine）。早在70年??代末，就有人发表了有关FEM的论文，1982年美国国家宇航局Langley??研究中心的O.O.Storaasli等撰文详细地介绍了该中心设计的供研究??用的FEM。该机器由1个处理器阵列、1台作为控制器的微机和1个并行??操作系统及一些模块化了的通用并行算法程序组成，用户使用系统的??文本编辑器和控制器的其它特殊功能，能建立有限元计算模型并进行??分析。10多年来，又有一些人在这一方面进行了不懈的努力，但FEM??的发展前景仍然不太令人乐观。??2）心动阵列并行机【26】。心动阵列并行机主要应用于信号和图象??的并行处理，但由于其高效的矩阵计算功能，近年来有人把它应用于??有限元分析，并作了一些有益的尝试。??3）巨型向量机【27】。在有限元分析中越来越显示出巨大的威力，??处于领先的是美国思维公司的CM-2。许多结构分析家把这个具有65536??个处理器的巨型向量机应用于有限元计算，如T.Belyschko等人采用显??式方法，完成了具有32768个单元的壳的非线性有限元计算，并行效率??极高，速度几乎比CRAY X-MP/14并行机高出1个数量级。??4）并行机网络和工作站网络【28】。日本东京大学矢川等借助高速网??络把3台CRAY Y-MP机联成网络进行有限元分析，有限元方程求解采用??的是基于区域分裂技术的共轭梯度法（CGM），在求解三维弹性问题??时自由度个数超过了100万，系统平均运行速度高达1.74GFLOPS。另外，??他们还基于一个工程工作站网络，在并行环境下进行了类似的研究，??求解问题的自由度数高达20万个。

并行和分布计算技术现状及发展策略上海交通大学计算机系陆鑫达

并行和分布计算技术自60 年代中期和70 年代后期分别出现以来，其并行处理方式经历了从阵列机(SIMD)、向量机及向量并行机、共享存储的对称多处理器系统(SMP)、分布存储的大规模并行处理系统(MPP) 到NUMA( 非一致访问的分布共享存储) 并行机系统和计算机机群系统(Clusters) 的演变过程。

在研制上述并行和分布计算系统的过程中，人们逐渐认识到，系统的规模可伸缩性(Scalabi lity) 和可编程性(Programmability) 已成为促使这两者进一步发展的关键问题。规模可伸缩并行计算机系统能以最低可能成本向用户提供最高可能性能，因此，已成为并行计算技术发展的主流；如果计算机或工作站已局部联网，

计算机机群( 工作站机群NOW/COW 等) 则能提供更为经济有效的高性能计算能力，而事实上已成为分布计算技术发展的主流。

一、对当前发展形势的基本估计

当前，并行和分布计算发展的基本状况是：

? 并行软件的发展远远落后于并行和分布计算体系结构的发展。

? 并行和分布计算应用远远落后于并行和分布计算技术的发展。

? 向尽量采用商品化的软、硬件甚至系统来构成并行和分布计算系统平台的方向发展。

? 计算系统的规模可伸缩性和可编程性已成为并行和分布计算系统进一步发展的一对主要矛盾。

? 由高速网联成的各种类型的、规模可伸缩计算机群，由于其经济有效性而发展很快，加上可移植异构编程环境PVM(Parallel Virtual MacRine) 日益流行和标准的消息传送平台MPI(Message Passing Interface) 并行编程环境的日益普及，已经并将进一步促使并行和分布计算应用有较大的发展。

? 由基于NUMA(Non-Uniform Memory Access) 方式构成的分布共享存储器(Distributed Shared Memory，DSM) 组成的并行机系统，特别是采用目录方法来保持各cache 之间数据一致性的CC-NUMA(Cache Coherent NUMA)，由于具有良好的可伸缩性和可编程性，已受到诸多计算机厂商的青睐，不少厂商已经和准备推出有关CC-NUMA 并行机系统。

? 大规模并行处理系统已不再是主要研究领域。由于负载难于平衡和相应的并行算法设计困难，据国外预测，在高能计算机市场中，MPP 所占的份额将从目前的7% 降为2000 年的3%。

二、国外重点研究领域

1  并行算法的设计、分析和实现

其中包括数值和非数值并行算法、同步和异步算法以及分布式算法；上述算法的时间和空间复杂性分析；算法的实现方法等。

2  并行优化编译

其中包括粗、中、细精度三个层次上的并行优化编译。并行化编译方法包括对程序中存在的并行性进行检测，即分析和判定各种相关性、相关性的消除方法、各种并行化程序变换技术，以及数组私有化识别和过程间分析等。优化编译方法包括减少程序执行的指令数的优化；提高Cache 中对同一数据的时间重用和对同一数据行的空间重用，即提高对Cache 访问的命中率优化，寄存器使用优化以及指令级程序并行执行优化，如基本块内指令级并行、跨基本块的指令级并行以及循环内的指令级并行优化等。

3  各种类型的规模可伸缩计算机机群间通信方法的研

搜索更多关于：并行发展史的文档

版权认领

下载文档10.00 元 加入VIP免费下载

推荐下载

本文作者：...

共分享92篇相关文档

文档简介：

计算机发展 ]从20世纪40年代开始的现代计算机发展历程可以分为两个明显的发展时代：串行计算时代、并行计算时代。每一个计算时代都从体系结构发展开始，接着是系统软件（特别是编译器与操作系统）、应用软件，最后随着问题求解环境的发展而达到顶峰。 ????并行计算机是由一组处理单元组成的。这组处理单元通过相互之间的通信与协作，以更快的速度共同完成一项大规模的计算任务。因此，并行计算机的两个最主要的组成部分是计算节点和节点间的通信与协作机制。并行计算机体系结构的发展也主要体现在计算节点性能的提高以及节点间通信技术的改进两方面。 ????节点性能不断进步 ????20世纪60年代初期，由于晶体管以及磁芯存储器的出现，处理单元变得越来越小，存储器也更加小巧和廉价。这些技术发展的结果导致了并行计算机的出现。这一时期的并行计算机多是规模不大的共享存储多处理器系统，即所谓大型主机。IBM

并行发展史

相关文档

相关推荐