高性能计算发展机群

高性能计算发展机群——未来高性能的发展方向高性能计算机的主流体系结构收缩成了三种,即SM、CC-NUMA、Cluster

在产品上,只有两类产品具有竞争力:一是高性能共享存储系统;二是工业标准机群,包括以IA架构标准服务器为节点的PC机群和以RISC SMP标准服务器为节点的RISC机群

当前,对高性能计算机产业影响最大的就是“工业标准机群”了,这也反映了标准化在信息产业中的巨大杀伤力

工业标准机群采用量产的标准化部件构成高性能计算机系统,极大地提高了性能价格比,从科学计算开始逐渐应用到各个领域

关键在应用20世纪90年代以来,中国在高性能计算机的研制方面已经取得了较好的成绩,掌握了研制高性能计算机的一些关键技术,参与高性能计算机研制的单位已经从科研院所发展到企业界,有力地推动了高端计算的发展

中国的高性能计算环境已得到重大改善,总计算能力与发达国家的差距正逐步缩小

随着曙光、神威、银河、联想、浪潮、同方等一批知名产品的出现,中国成为继美、日之后第三个具备高端计算机系统研制能力的国家,被誉为世界未来高性能计算市场的“第三股力量”

在国家相关部门的不断支持下,一批国产超级计算机相继面世,大量的高性能计算系统进入教育、科研、石油、金融等领域,尤其值得一提的是曙光4000A在全球TOP500中排名进入前十,并成功应用于国家网格主节点之一——上海超级计算中心

但是,从总体上讲,中国高性能计算应用的研究与开发明显滞后于高性能计算机的发展,应用的并行度普遍在百十量级,应用到更大规模的很少(并非没有需求)

提及摩尔定律,作为计算机发展的第一定律一直在引领IT产业的前行

不过随着多核技术的发展和应用,摩尔定律在面临挑战的同时,在某些领域已经被超越

例如在日益普及的高性能计算(HPC)中

那为何摩尔定律会首先在高性能计算领域被超越?这之中又隐含着怎样的产业趋势?首先从代表全球高性能计算水平和趋势的全球高性能计算TOP500近几年性能发展的趋势看,无论是最大性能(全球排名第一的系统)、还是最小性能(全球排名最后)和平均性能,其发展曲线的速度是基本一致的

但与摩尔定律的发展曲线相比,则明显处于陡势的增长态势

这说明这两年来,高性能计算性能和应用的发展速度已经超越了摩尔定律

熟悉摩尔定律的人都知道,摩尔定律有三种解释

一种是集成电路芯片上所集成的电路的数目,每隔18个月就翻一番;第二种是微处理器的性能每隔18个月提高一倍,而价格下降一半;第三种解释是用一个美元所能买到的电脑性能,每隔18个月翻两番

这三种解释中业内引用最多的是第一种

但具体到高性能计算,笔者更愿意用第二或者第三种来解释

按理说,随着高性能计算性能的不断提升和系统的日益庞大,高性能计算用户无论在初期的采购搭建系统,还是后期的使用中的成本都会大幅的增加,在经济危机的特殊时期,高性能计算如此大的TCO会导致用户的减少和整体性能的下降才对

但前不久发布的全球高性能计算TOP500证明,增长的势头未减,这除了市场和用户的需求外,更在于处理器厂商采用新的技术,在性能提升的同时,让用户以更低的成本享受到更高、更多的计算性能

从这个意义上看,摩尔定律在被延续的同时也正在被超越,即在高性能计算领域,用户性能/投入比远远大于摩尔定律

当然这主要得益于处理器制程、架构技术、多核技术、节能技术、软件优化和快速部署等

例如从制程和核数上看,最新的全球高性能计算TOP500排名显示,45纳米已经占据了绝对的主流

而多核也达到了全球TOP500的2/3

从部署的速度看,AMD刚刚发布不久的6核就已经有两套进入TOP500中

而英特尔正式发布的新的Nehalem多核架构的高性能计算系统更有33套(基于这个处理器的系统)进入TOP500,其中有两套在TOP20里

快速的部署给用户带来的是最新技术和性能的获得

当然对于用户而言,多核并非是关键,重要的是如何充分发挥多核的效能

这就需要相关的平台技术和软件优化

例如在高性能计算领域,业内都听说过“半宽板”这个标准

这个“半宽板”标准其实是英特尔在几年前提出的,半宽的小板在加高计算密度的同时,节约了很多复用的部件,在加强高性能计算的密度同时,配合散热的技术设计,可以提供更多的计算能力同时降低能耗

这就引出了一个新的发展方向,即高性能计算未来发展就是能耗更多被用于计算性能的提高,而不是散热

此外,就是SSD(固态硬盘),它可以在大幅提高高性能计算系统可靠性和I/O性能的同时,还可以降低功耗

而软件优化更是高性能计算中重中之重的部分,编译器、函数库以及MPI库,所有这些可以帮助ISV能够把多核处理器的计算性能充分发挥出来

由此来看,在高性能计算领域,单纯的处理器已经不能满足市场和用户的需求,它们需要的是高性能计算平台级的解决技术及方案

这也是为什么在全球高性能计算TOP500开始引入能效的主要原因

说到能效,笔者早就听说在业内有个与摩尔定律同样重要的“基辛格规则”

它是以处理器业界闻名的英特尔首席技术官帕特·基辛格名字命名的

该规则的主旨是今后处理器的发展方向将是研究如何提高处理器能效,并使得计算机用户能够充分利用多任务处理、安全性、可靠性、可管理性和无线计算方面的优势

如果说“摩尔定律”是以追求处理性能为目标,而“基辛格规则”则是追求处理器的能效,这规则至少在高性能计算领域已经得到了验证,而它由此带来的是摩尔定律的被超越,即用户将会在更短的周期,以更低的价格获得更高的能效

人类从人力推算到高性能计算机,倾注了无数人大量的心血和努力

对于现代天气预报和气象研究工作,高性能计算机则占据了极其重要的位置

气象工作离不开高性能计算机随着社会经济的发展,政府、社会和公众对气象预报和服务提出了更高的要求,特别是一些特殊气象保障任务需要预报员提供定点、定时、定量的精细气象预报和服务

而对于现代天气预报而言,为确保其实施的实效性和运行的稳定性,必然要求建立在数值预报基础之上,但数值模式普遍具有计算规模巨大、高精度等特点,于是高性能计算机便成为了现代气象研究的中流砥柱

数值天气预报水平的高低已成为衡量世界各国气象事业现代化程度的重要标志

美国国家大气研究中心与科罗拉多大学合作,采用了IBM蓝色基因超级计算机来仿真海洋、天气和气候现象,并研究这些现象对农业生产、石油价格变动和全球变暖等问题的影响

日本科学家研制成功了代号为“地球模拟器”的超级计算机,其主要目的就是要提供准确的全球性天气预报,使各个国家和地区更好地防御暴风雪、寒流和酷暑期的到来

我国是一个幅员辽阔的国家,在气候上呈现多层次、多样性、多变性等特点,尤其是近几年洪涝、干旱等自然灾害比较严重,及时、准确的天气预报逐步受到重视,因此随着地区气象市场的逐步成熟,更高效率的高性能计算机成为了人们关注的对象

作为国产服务器第一品牌的曙光公司,一直以来就非常关注气象领域对高性能计算机的需求

由于采用了软硬件一体化设计,曙光气象专用机在硬件平台上直接移植了在中尺度数值天气预报领域处于领先地位的NCA MM5系统,这套系统每天自动定时定点进行业务系统预报,从数据导入到气象绘图的整个流程自动完成,不需要人工干预;用户可以随时监控整个系统的运行,大大节约了操作的时间

甚至不需要任何计算机系统知识的培训,用户就可以快速掌握整个预报系统

而且该系统既可以作为业务预报系统,又可以作为气象研究和测试的平台,一机多用,用户可以根据自己的需要进行参数设定和算法调试

系统还提供了数据保存功能,使得用户可以对以往一个月内不满意的预报进行重新计算和分析,最大限度地满足了气象部门准确及时预报的需求

气象工作离不开高性能计算机,而且每隔三四年就有一次主机的更新,速度还要提高一个数量级

在前10年,我们还只能选择国外品牌高性能计算机,而近几年以曙光为代表的高性能计算机已经明显提升了气象服务的综合实力

曙光机在我国气象领域取得了非常广泛的应用,大大促进了中国气象科技水平的提升,为老百姓的日常出行和众多国家重大工程提供了强有力的保障

从日常天气预报到大型气候研究、从陆地到海洋、从地面水文气象到太空天气等领域,都活跃着曙光高性能计算机的身影

 天河一号(TH-1)全称“天河一号超级计算机系统”,是一台由中国国防科大和天津滨海新区提供的异构超级计算机,名字“天河”意思为“银河”

天河一号的操作系统为银河麒麟

浪潮集团也参与了这一全球超级计算机的建设工作

2010年10月,《2010中国高性能计算机TOP100排行榜》正式对外发布,经过技术升级优化后的“天河一号”超级计算机系统,以峰值性能每秒4700万亿次、LINPACK实测值持续性能每秒2507万亿次的性能再登榜首

升级优化后的“天河一号”,配备了14336颗至强X5670处理器、7168块基于Nvidia “Fermi”架构的Tesla M2050计算卡、2048颗国防科技大学研制的飞腾处理器以及5PB存储设备

天河-1A峰值性能提高了3.89倍,持续性能提高了4.45倍,其运算速度与能效均达到当前国际领先水平

升级后的“天河一号”的实测性能是此前全球最快的超级计算机美洲虎的1.425倍

与诞生于一年前的“天河一号”一期系统相比,二期系统的峰值性能和持续性能分别提高了2.89倍和3.45倍

其峰值速度为4700TFlops,持续速度为2566TFlops(LINPACK实测值),参加2010年11月世界超级计算机TOP500排名,位列世界第一

 根据2014年6月份TOP500的排名,中国国防科大开发的天河二号连续第三次位列世界第一,LINPACK实测速度33,862.7TFlop/s,理论峰值54,902.4TFlop/s

以上内容由大学时代综合整理自互联网,实际情况请以官方资料为准。

相关