打印

[转帖] 【科技】憋了5年美国超算重超中国,但只能秀半年

0

【科技】憋了5年美国超算重超中国,但只能秀半年

周末最大的科技新闻,应该是美国超级计算机重夺世界第一,速度超过了中国“神威”60%。
笔者也正好借此机会向公众介绍一下超级计算机领域激烈的中美竞争。而且这应该是真正最完整和最通俗的解读了。
这将是自2013年6月以来,美国首次登上超级计算机的榜首,当时它被中国广州的天河二号夺去了第一名。到2016年,中国无锡的神威-太湖之光,又以3倍的优势大幅度刷新记录,继续为中国把持着榜单首位。

在上一轮,也就是去年年底的全球超级计算机TOP500排行上,美国的最高排位已经被瑞士和日本挤到了第五位。

而在TOP500总榜单中,中国系统总数为202台,占比超过四成位居第一。美国只剩143台。中国在总体算力上也超过了美国。在TOP500的总算力中,中国占了35.4%,美国只有29.6%。
再往下的国家数字就很少了,日本35台,德国20台,法国18台,英国15台……这就是当今全球顶尖科技与商业的竞逐写照:只有中美两个大玩家。


【请不要再用人手去类比了——G的十亿级领域】
在进一步介绍之前,很有必要科普衡量现代计算机性能的基本专业参数——每秒浮点运算次数(英文缩写:FLOPS)。否则,一味地还在采用“相当于全球70亿人手按多少百亿年计算器”,实在既不直观,也难比较。
从鼻祖ENIAC的300 FLOPS开始,计算机开始了指数化发展的历程。在英文词汇与缩写里,K是千,10的3次方;M是百万,10的6次方;G是十亿,10的9次方,以此进位。
在超级计算机(简称超算)首次被中国媒体报道的80年代中期,超级计算机的速度是1 GFLOPS量级,也就是每秒十亿次浮点运算。

1983年中国造出第一台银河一号巨型计算机,每秒运算一亿次以上,也就是0.1GFLOPS。而当年全球最快的美国克雷,则是八亿次,也就是0.8GFLOPS。
放在今天,这性能大概连块电子表都不如。
十五年后,到了90年代末期,个人电脑上的CPU开始出现1 GFLOPS的能力,而此时全球最快的超级计算机,性能已达到了1 TFLOPS以上——T是一万亿,10的12次方。

因此个人电脑与同时代专业超算的差距,是1000倍。
而再过十五年,2014年的个人电脑CPU就有0.6 TFLOPS的能力,现在2018年的顶级手机CPU,也具备了同样的水准。
绝大部分人都不会意识到,手上小小的智能手机,竟然堪比20年前极其庞大笨重的全球最强超算,而且体积重量也缩小了1000倍。
否则,还怎么玩微信、刷视频、打游戏,以及实时美颜?那都是以接近T级的计算能力,实时算出来的!
所以TFLOPS(万亿),才应该是讨论现代计算机的起点。否则,数据后面所列的〇和亿太多,实在超出了普通人的理解力和想象力,也脱离当下的发展现实。

【同样的,专业超算要保持比个人玩具强1000倍——P的千万亿级领域】
而主要用于游戏的显卡,由于几百个运算单元并行处理的特性,性能增长还高出一个数量级。
以目前市场上最热销、最主流的NVIDIA GTX 1060游戏显卡为例,它的成品价格是2000多元人民币,游戏单精度计算能力是4.4 TFLOPS,比传统CPU高了约10倍。
再往上,目前NVIDIA最新的顶级显卡Titan V达到了15 TFLOPS,是GTX 1060的三倍多,当然,售价也达到了两万多元。

而当TFLOPS再增长1000倍,就是PFLOPS(千万亿)。这才是当今专业超算的能力范畴——实际1个PFLOPS能力的超算,在去年底的榜单上,能排在全球183位。


为了夺回被中国占据的最快超算王座,早在2015年,IBM和NVIDIA就接下了美国政府的订单,要为掌管研制核武器的美国能源部所属的橡树岭国家实验室、劳伦斯利福摩尔国家实验室,分别打造20亿亿次和15亿亿次,也就是200 FLOPS和150 PFLOPS的超算。
两台超算分别命名为Summit和Sierra,总耗资约3.8亿美元。但一直要到2017年底,两家公司研制出相关核心芯片之后,才能转换为工程现实。


橡树岭国家实验室名为“顶点”(Summit)的超算,使用了4608个计算服务器节点,每个节点含有2个IBM的Power 9处理器(CPU)和6个NVIDIA(英伟达)公司生产的Tesla V100图形处理单元加速器(GPU),以及512 GB的DDR4 内存。采用效率更高的水冷散热。


NVIDIA的Tesla V100,采用台积电12纳米工艺制造,集成了210亿个晶体管,外围是32 GB内存。每个售价9000美元。


Tesla V100和民用顶级显卡Titan V同为Volta 架构,但考虑稳定性频率略低,理论计算能力为单精度14 TFLOPS,但科学计算都用双精度模式,为7 TFLOPS。
GPU接管了大部分的工作负载,但CPU仍然是数据处理的中心。IBM的POWER9,采用格罗方德(原AMD的制造部分)的14纳米工艺制造,集成了拥有80亿个晶体管。具有24核96个线程,实际使用22核。每颗售价6000美元起。
这样,单个节点拥有6块双精度7 TFLOPS的V100,理论计算能力就超过42 TFLOPS。4608个节点合起来,就是20万个TFLOPS,200个PFLOPS——用中文说就是20亿亿次。
这相当于个人电脑中高端游戏显卡的9万倍,主流CPU的90万倍。也比美国目前排名世界第五的的最强系统‘泰坦’(Titan)强8倍。

当然,比起个人电脑,一要解决大规模集成与互联并行计算,二要解决超大数据量吞吐与节点间交换,三要追求更高的效率和更高的功耗比,这就需要最先进的配件。
【只花了2亿美元?背后是几十亿美元的研制经费】

单算比例分摊,Summit的造价的确是2亿美元出头,看似并不多,在中国也就能修一公里多地铁,在美国连毛都不算。
但是,光TESLA V100及其背后的Volta 架构,就凝聚了Nvidia 7000 多名工程师超过3 年的研发,投入资金达30 亿美元。IBM的Power 9以及总体架构设计也要花差不多同样的钱。IBM的女CEO罗睿兰(Ginni Rometty)表示:“这是我们最大的成就之一,它是最快、最智能的超级计算机。”美国能源部长里克•佩里自豪地表示:“Summit的发布体现了美国在科学创新和技术开发方面的领导实力。它将对能源研究、科学发现、经济竞争力和国家安全有深远影响。”

另外,Summit的理论总计算能力是200 PFLOPS,也就是20亿亿次。但实测的真实计算能力还未公布,因为理论加总的总和本无法全部兑现。


中国的神威-太湖之光,理论能力125 PFLOPS,实测对兑现了93 PFLOPS,效率近75%,已经是很高的记录了。

美国之前排名第三、全球第七,能源部洛斯阿拉莫斯国家实验室的Trinity,实测效率不到32%。可见系统架构设计有问题。美国虽然能借Summit 重回超算榜首地位,但这个宝座恐怕坐不了多久,根据中国最新的进展,恐怕到年底,中国超算就有望重新取而代之。想必,中国超算的最新进展及其应用场景,才是广大读者真正更关心的话题。
本帖最近评分记录
  • a59159a 金币 +5 感谢分享,论坛有您更精彩! 2018-6-9 23:51

TOP

0
科技总是在不断进步,没有这样的超越,哪来的反超。

TOP

0
这里只关注利超算王位之争,没有计算能源消耗,据说超算运行一个小时的能源消耗相当于5吨煤的热量,相当惊人。另一方面,芯片的制程已经到了5纳米,潜力几乎被挖掘殆尽,必须发展新的理论。谁先在这一领域成功就可能制霸新一轮的超算王位之路。
本帖最近评分记录
  • a59159a 金币 +2 认真回复,奖励! 2018-6-10 15:07

TOP

0
先不评价这个榜单,比较的有没有意义。
中国目前还不能自主研发超算服务器的核心部件之一CPU吧?
太湖之光里大部分的核心元器件还是来源于米国工厂吧?(龙芯不是干这个的。)
对于超算机,如果不具备CPU这部分的研发能力,
即使国内某些机构有构架和布线设计专利,设计出的产品还能获得计算速度的连续第一。
那么这种第一,其实得算是一种虚妄的成绩。
可能会有这样的辩解:超算的研发机构都是世界采购啊,我们当然可以买米国它们的成熟的产品啊。
怎么米国重新超越的第一就是真材实料?中国的成绩就是饱含水分?
试想:米国的研发机构某一天升级了刀片服务器的CPU ,然后再把这种器件划归到对中国禁运的名单里。
超越回并且保持这个世界第一,是轻而易举的。于是中国的超算在短时间内还可以接近并保持世界水平。
但长时间看,估计产品就只能原地踏步了。
(多年前就是这么做的。当年的中国,在各个行业急需超算支持的年代,米国就是曾把超级计算服务器相关产品列为禁运的。
因此当年中国的相关研究机构就处于无物可做的境地。勉强为之的结果,计算的峰值自然就上不去。就一直就被西方压着。)

不是不为我们的科技进步叫好,而是该更客观的看待这个问题。
中国的超算曾经领先并保持世界计算速度第一,的确振奋民心,甚至都成了中国年度科技新闻。
但这个行业的确是潜在着危机。

另外三楼说过:“超算运行一个小时的能源消耗相当于5吨煤的热量”,没注意过这个数据,也许换算成为发热量是对的。
但这远远不是超算运行一个小时的能源消耗,如果仅仅消耗五吨煤,只怕从业者们会高兴死。
一台中等规模的超级计算设备,一个月的电费,加上损耗,换算成钱,大概也要一百至几百万元。

而今,对应用计算机的设计已经转向着重于,专业化计算和低消耗计算。
那种只靠并联CPU 以期获得更高计算峰值的设计思想,可能要落后了。
本帖最近评分记录
  • a59159a 金币 +7 认真回复,奖励! 2018-6-10 23:22

TOP

0
我们的路还长,不要急慢慢做扎实

TOP

0
我们的崛起,必然导致西方的垂涎!马可波罗游记中记述了中国皇家的屋顶都是黄金和翡翠(金色和绿色琉璃瓦),仅因为这一点,西方国家的议会体系就讨论了无数次是该去抢过来还是买过来!如今中国在一部分领域的技术领先世界且反过来向西方封锁技术出口,他们就开始不断指责中国封锁技术耽误了人类的进步,他们却选择性忘记了他们向中国及其他国家封锁技术时也同样是“耽误了人类的进步”,这就是列强!千万不要忘记MAO主席said:帝国主义往我之心不死!
本帖最近评分记录
  • a59159a 金币 +3 认真回复,奖励! 2018-6-13 23:35

TOP

当前时区 GMT+8, 现在时间是 2025-3-11 06:57