在最新出炉的《全球500强》(TOP500)超级计算机排行榜中,美国重新赢回超级计算机运算性能的龙头地位,但能够维持多久还有待观察。而中国大陆不仅在高性能系统数量方面持续领先,同时也在竞争最先推出每秒百万兆浮点运算(exaflop1018)计算机的排名。

最新的TOP500排名让美国暂居上风,但也显示中国大陆在计算机技术方面持续精进。此外,这项最新排行榜发布时间,刚好就在中美两国间的贸易战升温之际——引发两国贸战的部份原因就在于双方对半导体政策的冲突。

从最新的TOP500排行榜还可看出,加速器继续驱动着全世界最强大的计算机系统,特别是辉达(Nvidia)的绘图处理器(GPU)。除了Nvdia,英特尔(Intel)以及总部位于日本的加速器制造商Pezy Computing也在此排行榜中崭露头角。

在历经没有任何一台系统挤进前四强的一年后,美国的超级计算机在这次的TOP500排行榜上分别名列第一和第三。美国橡树岭国家实验室(Oak Ridge National LaboratoryORNL)的「颠峰」(Summit)超级计算机系统在Linpack基准测试上测得122.3 petaflops的运算效能,大幅领先之前中国大陆「神威.太湖之光」(Sunway TaihuLight)93 PFlops

美国劳伦斯利弗莫尔国家实验室(Lawrence Livermore National LaboratoryLLNL)Sierra系统,则以71.6 PFlops排名第三。SummitSierra都采用IBM Power 9处理器和Nvidia Tesla V100加速器,透过Mellanox Infiniband EDR互连4,300多个节点。

Linpack的整体基准测试性能来看,美国的超级计算机以38.2%的整体表现,超越中国的29.1%,重登排行首位。就在6个月前,双方的排名位置还刚好相反。

如果采用新的高性能共轭梯度(HPCG)基准测试,测试结果还更加明确。SummitSierra系统分别以2.926 PFlops1.79 PFlops领先在HPCG基准测试的排名。

相形之下,中国大陆的太湖之光排名第六,成绩为0.481 PFlops。中国大陆第二大系统天河2(Tianhe-2)则以0.038 PFlops排名第49。其他的中国系统使用该基准测试的排名均在100名之后。

Linpack长期以来一直被视为是相对粗糙的原始理论性能测量标准。相形之下,美国田纳西大学教授Jack Dongarra说,HPCG使用的程序码则测量7种运算指标,「更能强调资料的动态,特别是在许多实际应用中。」

尽管这次暂时在性能方面小输,但中国大陆目前在TOP500中拥有206台系统,较6个月前的202台系统更多,持续在TOP500超级计算机数量方面领先。而美国这次创历史新低仅有124台超级计算机,较201711月时的145台大幅减少。

此外,联想(Lenovo)目前拥有最多台计算机系统(119),这是中国大陆供应商首次在这个项成绩上脱颖而出。慧与科技(Hewlett Packard EnterpriseHPE)原本以122台系统领先,目前则只有79台。其后排名分别是浪潮集团(Inspur)Cray和中科曙光(Sugon),分别拥有685655套系统。

排名第六的IBM仅列出19台系统,但由于SummitSierra超级计算机的采用,使其拥有在Linpack整体性能排名中占19.9%Cray和联想则分别以16.5%12%位居其后。

中国竞逐Exaflop目标

Dongarra表示,虽然中国大陆在这次最新的TOP500排行榜表现不如预期,但自2016年以来一直在加速下一阶段的技术进展。预计中国大陆将推出第一套在Linpack基准测试取得exaflop级运算效能的系统,甚至可能比美国更提前一年。

目前,在中国大陆的三支团队正竞相打造约512个节点的相对较小原型系统,每个节点使用不同的架构。根据其开发结果可能决定哪一支团队将获得资金,打造最终的exaflop超级计算机,预计最早可能在2020年。

Dongarra表示,这三项计划由中国服务器供应商中科曙光以及天河、神威超级计算机背后的团队为主导。多家大学院校、研究机构和国家超级计算机中心均参与了这项合作计划。

中科曙光系统用于连接在6D环形网络上的10,000多个节点,每个节点使用与AMD共同开发的x86处理器。预计天河团队将采用同样用于天河2A中的本土Matrix 2000版本,可能再增加基于Arm的处理器或加速器。神威原型则大致上沿用太湖之光的多核心途径。

一年前,美国政府拨款了2.58亿美元,计划在2021年之前推出百万兆级(exascale)的系统。Dongarra表示,中国和美国共同的目标都在于提供一个支援30GFlop/W效能和超过500Gbitsexaflop系统。

在全世界最强大的系统中有越来越多都使用了加速器——在目前TOP500系统中就有110台系统采用加速器,比6个月前统计的101台增加了。Nvidia GPU是迄今最普遍获得采用的协同处理器,出现在其中的96台系统中,其中包括前10大系统中就有5台采用。

TOP500中有7台系统使用了英特尔的Xeon Phi协同处理器,日本的4台系统则使用相对较新的Pezy加速器。

有趣的是,在另一项测量节能效率最高的「全球前500强超级计算机」(Green 500)排行榜中,前三大系统都采用了Pezy加速器,而前十大的其余系统则使用Nvidia GPU作为加速器。

Dongarra说:「Pezy系统采用液体冷却方式——也就是说,整个系统浸没在液体中[通常是3MFluorinert版本],这比透过板载空气或水更具有节能效率。」

Top 500中的大多数系统都使用英特尔Xeon CPU作为主处理器。此外,目前有将近一半(247套系统)都使用了10-Gbit/s乙太网络作为其互连,在6个月前这一数字为228

TOP500中采用相对更昂贵的Infiniband作为互连的系统,则从6个月前的163台减少到目前约139台。英特尔专有的Omni-Path互连在最新排行榜中则有38台系统,较6个月前的35台略高。