Chiphell - 分享与交流用户体验

 找回密码
 加入我们
搜索
      
查看: 4361|回复: 49

[通讯科技] 美国Summit超级计算机:采用超过27000块NV计算卡

[复制链接]
发表于 2018-6-14 08:01 | 显示全部楼层 |阅读模式

https://www.ithome.com/html/discovery/364827.htm


IT之家6月14日消息 美国推出了世界上运行速度最快的超级计算机。美国能源部当地时间星期五公布了新一代超级计算机Summit,其合作伙伴是IBM和英伟达。美国能源部称其运算性能为200PFlops。去年蝉联世界第一的中国神威·太湖之光为93.9PFlops。


目前外媒已经曝光了Summit所搭载的计算单元,包括NVIDIA Tesla V100计算卡和IBM Power处理器,据悉Summit共有27648块Tesla V100计算卡以及9216颗IBM Power CPU,NV表示这些流处理器通过NVLink进行连接。每一块Nvidia Tesla V100计算卡拥有512颗流处理器,所以Summit一共拥有141557760个CUDA。另外Summit还拥有10PB(10000TB)的系统内存,以及250PB的存储空间。

Summit的双精度浮点性能为200PFLOPs,而单精度浮点性能则为400PFLOPs。基于国产众核处理器的神威·太湖之光,其持续计算能力为93PFlops,紧随其后的中国天河二号计算能力33.9PFlops。


发表于 2018-6-14 08:26 | 显示全部楼层
这玩意给了多少预算
发表于 2018-6-14 08:35 来自手机 | 显示全部楼层
这同一个消息怎么发这么多遍,重复了得删!
发表于 2018-6-14 08:48 | 显示全部楼层
本帖最后由 tryqandy 于 2018-6-14 08:52 编辑
stevewang 发表于 2018-6-14 08:26
这玩意给了多少预算

Summit造价2.2亿美元 ,太湖之光造价18亿人民币
Summit功耗13MW ,太湖之光功耗15.3MW


发表于 2018-6-14 08:49 | 显示全部楼层
fairness 发表于 2018-6-14 08:35
这同一个消息怎么发这么多遍,重复了得删!

对的,老是重复信息,毫无意义。
发表于 2018-6-14 08:59 来自手机 | 显示全部楼层
tryqandy 发表于 2018-6-14 08:48
Summit造价2.2亿美元 ,太湖之光造价18亿人民币
Summit功耗13MW ,太湖之光功耗15.3MW


按照摩尔定律,很科学啊
发表于 2018-6-14 09:02 | 显示全部楼层
tryqandy 发表于 2018-6-14 08:48
Summit造价2.2亿美元 ,太湖之光造价18亿人民币
Summit功耗13MW ,太湖之光功耗15.3MW

这不科学,光27000块NVIDIA Tesla V100计算卡价格都不至2.2亿美元,还不包括其他IBM Power处理器、连接设备等等。

  1. NVIDIA表示将会率先更新用于深度学习超算DGX-1上,内部同样集成了8张Tesla V100,提供960 TFLOPS Tensor深度计算性能,能够在8小时完成TITAN X需时8天的计算量,极大地节约科研人员等待深度计算结果时间。就当然啦,拥有8张真·核弹的新DGX-1售价并不便宜,149000美元,折合人民币102万元。
复制代码
http://net.yesky.com/internet/9/169310509.shtml
发表于 2018-6-14 09:04 | 显示全部楼层
本帖最后由 聚沙成塔 于 2018-6-14 09:06 编辑
tryqandy 发表于 2018-6-14 08:48
Summit造价2.2亿美元 ,太湖之光造价18亿人民币
Summit功耗13MW ,太湖之光功耗15.3MW

如果你说的数据都是可信的,也没问题,你看,美国落后6-7年了,所以一直需要赶超,如果赶超对手,不能有一些优点,比如浮点高,造价低或者功耗低,哪有任何意义吗,况且美国的还是时间上更加靠后发布的,占时间优势,和早一些时间发布的中国的太湖之光相比,当然优势,理应有所突破,不然太掉价了,对伐?
以后几年这方面中美肯定是交替领先,互相赶超和攀比。
不信2025年来看结果,此回帖为证!
发表于 2018-6-14 09:22 | 显示全部楼层
这玩意挖矿,老带劲了
发表于 2018-6-14 09:26 | 显示全部楼层
lhasa 发表于 2018-6-14 09:02
这不科学,光27000块NVIDIA Tesla V100计算卡价格都不至2.2亿美元,还不包括其他IBM Power处理器、连接设 ...

这要看谁采购了,出厂价了,批发价了
发表于 2018-6-14 09:32 | 显示全部楼层
本帖最后由 reaper 于 2018-6-14 09:34 编辑

,你们都没说到点子上.....
美国的思路还是先看老黄现在造出来什么特斯拉,然后想办法把尽可能多的特斯拉堆到一个节点里面,再把节点连起来

太湖之光走的路线是从上到下的,思考什么样的思路能够达成100P的需求,然后根据这样的思路,计算如何弱化CACHE的众核节点,足够完成目标,又不会在缓存上浪费过多的能耗和等待时间.

据说我国的E级超算已经快要进入测试阶段了.

发表于 2018-6-14 09:36 | 显示全部楼层
顺便转一篇国外要钱的文章看看,虽然字里行间都透露着:"给钱",但至少说的很中肯.

原帖地址:https://www.quora.com/Can-the-US ... 00-petaflops-Summit
翻译:Tiberium



问题:Can the USA overtake China in the supercomputer race with her 200 petaflops Summit?
问题:美国能不能用200P的Summit干赢中国?


回答:Regrettably, no. The USA needs to aim for at least 2 exaflops if they are starting now, since it takes about two or three years to go from design to actual running hardware.
回答:很遗憾,不行。美国现在想要动的话至少得以2E为目标,所以需要两到三年才能够从设计变成实际能跑起来的硬件。


Sitting in Singapore, I am in the unusual position of having visited the Chinese #1 and #2 supercomputer sites and met with their designers, and also being familiar with the usual TOP500 sites in the US and what some of their plans are.
由于我在新加坡,我参观了中国第一和第二的超算,并且跟他们的设计师会了面,这很不同寻常,同时我也对美国的的一般TOP500的超算和他们的计划很熟。


As a citizen of the USA, I find the disparity discouraging. The Chinese already have a 1 exaflops system in their pipeline, and their designs are excellent and getting better. By the time the USA ekes out a 200 petaflops system, the Chinese will almost certainly have one already in operation that runs circles around it.
作为美国公民,我觉得这种差距很让人丧气。中国人已经在开发一个1E的机器,他们的设计非常出色,而且越来越好。美国人把200P的机器弄出来的时候中国人肯定就已经把那个1E的机器弄的差不多了,在跑测试。
While the USA economy grew slowly from 2001 to 2016, China’s economy grew very quickly and in some specific areas they actually surpassed the USA, supercomputing being one of them. Their supercomputer engineers did a lot of things right:
当美国经济从2001到2016缓慢增长的时候,中国经济增长得非常快,而且在某些特定领域已经超过美国,超算就是其中之一。他们的超算工程师做了很多对的事情:

    They were willing to spend the large amount of money required to compete in this arena.
    他们愿意在这个领域竞争,投入了很多钱。
    They were not wedded to the x86 processor mentality, and instead created a hardware-software stack (mostly based on the Alpha processor and its associated software that they had licensed) that delivers significantly more speed per watt of power. Alpha processors achieve about twice as many instructions per clock as do x86 processors.
    他们没有局限于x86处理器,相比之下他们做了一个硬件-软件集合体(基于他们之前买授权的Alpha处理器和相关软件),这套东西能够输出比x86多得多的每瓦算力。Alpha处理器能够处理相当于x86两倍的每秒指令。
    They took a holistic approach to the physical design, from the building structure to the cooling system to the custom cabinet design, instead of restricting themselves to easily-available and low-cost solutions to those challenges.
    他们全盘考虑了硬件设计,从建筑结构到冷却系统到定制的机柜设计,而不是局限于很容易搞到的和低成本的解决方案。
    They bought or licensed USA technologies and picked out the best ideas, then combined them with shrewd ideas of their own.
    他们买了或者拿到了美国技术的授权,挑出最好的点子,与他们自己的好点子结合在一起。

I should probably note that my colleague Jack Dongarra has written that Taihu Light is not based on the Alpha processor. With all due respect, he should ask one of his Mandarin-speaking graduate students to read the Taihu Light literature that has not been translated into English. The use of Alpha appears in the original, but not in the English translation… I am surrounded by bilingual Singaporeans who can confirm this! There may have been sensitivity that the designers would be accused of ripping off USA technology, so they de-emphasize that aspect of their design. They shouldn’t. There was easily enough innovation in the Taihu Light to earn the designers not just one, but two Gordon Bell Prizes.
我这里应该提到我的同事Jack Dongarra写过太湖之光不是基于Alpha处理器的。说实话,他应该问问他手下的大陆研究生去读一下那些没被翻成英语的太湖之光的文章。中文版是有说用了Alpha的,但是英文翻译就没了。我周围的懂双语的新加坡人确认了此事!设计师可能是害怕会被人指责说是偷窃了美国技术,所以就没有提到设计的这方面。他们这么做很不应该。太湖之光的创新足够让设计师拿到不止一个,两个Gordon Bell奖。
Each processor of Taihu Light looks like the Cray T3D on a chip. The Cray T3D was a nimble system based on Alpha processors that many HPC people feel was one of the best-designed supercomputers of all time.
太湖之光的每个处理器都像是一个芯片上集成了一整台Cray T3D。Cray T3D是一个很牛逼的机器,基于Alpha处理器,很多超算人认为这是有史以来设计的最好的超算之一。
Most supercomputers are severely communication-bound; the T3D was much less so, with an unusually good system balance and low-latency interconnect that made it easier to sustain a high fraction of the peak rated speed. Imagine a 256-processor T3D on a single chip (together with four processors that service that array), and a cleverly-cooled cabinet that packs hundreds of those close together, and a roomful of those cabinets, and you have a system that makes the DOE and NASA labs in the USA go… *gulp*.
绝大多数的超算严重的受到通讯的限制。T3D很大程度上克服了这点,他们有一个非常好的系统平衡,以及低延迟的互联系统,这让它能够很容易的维持在顶峰速度的高荷载上。想象一个256核的T3D集成在单片上(同时还有四个处理器协同阵列),以及一个设计的很聪明的冷却机柜,将几百片这样的处理器塞在一起,再把一个房间装满这样的机柜,你就有了一台能够让能源部和NASA实验室羡慕嫉妒恨的机器。
If the USA wants to really get back in the game and not just play catch-up, they need to break the me-too paradigm of filling standard racks with x86 processors that have GPU accelerators attached. We can get an order of magnitude improvement in operations per joule by rethinking everything. If I were doing it, I’d use a Very-Long Instruction Word (VLIW) processor with no caches, no instruction lookahead or speculative execution or branch prediction, explore the use of gallium nitride with 16-level logic instead of silicon CMOS, change the numeric representation from IEEE floats to posit arithmetic, connect the cabinets with free-space optics at terabytes per second per channel and a full crossbar, use only stacked memory and extensive use of in-processor RAM and ROM, and declare it a “moon shot” to make such a system work by 2022. This is the way all the great breakthroughs in supercomputing have been made historically… by being willing to change paradigms. Right now, the Chinese are proving better at breaking from legacy thinking than the USA.
如果美国真的想要胜利,而不是追赶,他们就不应该局限于那种“我也行”的思路,把一大堆带GPU加速器的x86处理器塞在一起。如果我们重新思考,就能够将每瓦的计算力提高一个数量级。如果我来干这事情的话,我会用一个超长指令处理器(VLIW),不带缓存,不要向前检测,推测执行或者分支预测,探索使用16层逻辑的GaN而不是硅CMOS,将数字表示从IEEE浮点换成假定算式,将机柜用free-space光纤连接起来,带宽在TB级别,只用堆叠内存和片上RAM和ROM,宣布这是个“革命性产品”并且节点在2022年运行。(译者:我不懂超算所以这段翻得不好大家姑且看看)这是历史上所有超算巨大突破的路径——愿意去做范式更新。目前,中国人证明他们比美国人更有勇气革新。
发表于 2018-6-14 09:38 | 显示全部楼层
以前是美苏军备竞赛,现在是中美超算竞赛
发表于 2018-6-14 09:39 | 显示全部楼层
本帖最后由 reaper 于 2018-6-14 09:46 编辑
lhasa 发表于 2018-6-14 09:02
这不科学,光27000块NVIDIA Tesla V100计算卡价格都不至2.2亿美元,还不包括其他IBM Power处理器、连接设 ...

我研究了一下这个项目,其实是能源部牵头,有IBM,NV,田纳西橡树岭国家实验室(没错,就是美国nuke的发源地)联合开发的.

所以内销价格肯定比"邪恶毒菜"的某国采购价有天差地别.

这台服务器有4608个节点,每个节点拥有两枚Power9,6张NV V100,总内存是10PB.....豪就是豪,堆起硬件都透露着一股豪气.

发表于 2018-6-14 09:49 | 显示全部楼层
不管怎么说,老黄还真是挺厉害的,各个提前布局的领域现在都开始领先业界了,果然格局和眼光不同凡响呀!
发表于 2018-6-14 09:49 | 显示全部楼层
lhasa 发表于 2018-6-14 09:02
这不科学,光27000块NVIDIA Tesla V100计算卡价格都不至2.2亿美元,还不包括其他IBM Power处理器、连接设 ...

公开价格不说明问题,卖给爸爸一个价,卖个邻居另外一个价,卖给老丈人,估计要狠宰一刀了。
发表于 2018-6-14 10:00 | 显示全部楼层
reaper 发表于 2018-6-14 09:39
我研究了一下这个项目,其实是能源部牵头,有IBM,NV,田纳西橡树岭国家实验室(没错,就是美国nuke的发源地)联 ...

没有中间商赚差价企业多卖钱,纳税人少交钱
发表于 2018-6-14 10:03 | 显示全部楼层
一直很好奇超算主要的作用是什么啊?军事还是科研?能几开绝地求生啊?
发表于 2018-6-14 10:03 | 显示全部楼层
wenzi2203 发表于 2018-6-14 09:26
这要看谁采购了,出厂价了,批发价了

政府采购哪国都不便宜
发表于 2018-6-14 10:07 | 显示全部楼层
Filter 发表于 2018-6-14 09:49
不管怎么说,老黄还真是挺厉害的,各个提前布局的领域现在都开始领先业界了,果然格局和眼光不同凡响呀! ...

说来说去还是黄种人脑袋瓜好使,如果没有喜欢内耗这毛病,现在站在世界之巅的肯定是黄种人
发表于 2018-6-14 10:32 | 显示全部楼层
"如果我来干这事情的话,我会用一个超长指令处理器(VLIW),不带缓存,不要向前检测,推测执行或者分支预测,将数字表示从IEEE浮点换成别的模式" -- 这说的不就是GPU嘛
发表于 2018-6-14 10:41 | 显示全部楼层
reaper 发表于 2018-6-14 09:36
顺便转一篇国外要钱的文章看看,虽然字里行间都透露着:"给钱",但至少说的很中肯.

原帖地址:https://www.qu ...

感谢翻译,,,美国人就是实事求是,,自己不足就是不足,从不会诋毁别人吹嘘自己,我觉得这才是一个民族最稳定的基础
发表于 2018-6-14 10:48 | 显示全部楼层
lhasa 发表于 2018-6-14 09:02
这不科学,光27000块NVIDIA Tesla V100计算卡价格都不至2.2亿美元,还不包括其他IBM Power处理器、连接设 ...

这是厂商设计用来立flag和靠后续算力租赁服务赚钱的,硬件哪怕亏本也会做。

更何况自产自用的产品怎么可能用零售价算成本?
发表于 2018-6-14 10:51 | 显示全部楼层
farwish 发表于 2018-6-14 10:41
感谢翻译,,,美国人就是实事求是,,自己不足就是不足,从不会诋毁别人吹嘘自己,我觉得这才是一个民族 ...

醒醒,这只是一小部分美国科研人员.大部分美国人有色眼镜是标配.
发表于 2018-6-14 11:16 | 显示全部楼层
本帖最后由 farwish 于 2018-6-14 11:21 编辑
reaper 发表于 2018-6-14 10:51
醒醒,这只是一小部分美国科研人员.大部分美国人有色眼镜是标配.

也不全是吧,至少我**看到的关于太湖的国外的评论,都是说牛逼,从个人的youtubeR到大报纸

不可否认自夸这点 某国第二没人敢说第一吧
就说中美两国哪个更实事求是,美国还是略微实干点的吧

再说有色眼镜,觉得在中国政府带节奏下,,现在中国人对美国的有色眼镜远大于美国队中国吧  只是一个是政治上  一个是经济上
发表于 2018-6-14 12:06 | 显示全部楼层
farwish 发表于 2018-6-14 11:16
也不全是吧,至少我**看到的关于太湖的国外的评论,都是说牛逼,从个人的youtubeR到大报纸

不可否认自夸 ...

不对  是美国人都给洗脑洗傻了
发表于 2018-6-14 12:11 | 显示全部楼层
tryqandy 发表于 2018-6-14 08:48
Summit造价2.2亿美元 ,太湖之光造价18亿人民币
Summit功耗13MW ,太湖之光功耗15.3MW

年代不一样了,对方用的是新的计算卡吧
发表于 2018-6-14 12:15 | 显示全部楼层
farwish 发表于 2018-6-14 11:16
也不全是吧,至少我**看到的关于太湖的国外的评论,都是说牛逼,从个人的youtubeR到大报纸

不可否认自夸 ...

我擦...论自夸某国离美国差远了好吧...你是真没接触过美国人还是怎么地。。。
发表于 2018-6-14 12:25 | 显示全部楼层
catabao 发表于 2018-6-14 12:15
我擦...论自夸某国离美国差远了好吧...你是真没接触过美国人还是怎么地。。。 ...

意淫强国也不知道说的某国,,说自夸你是没看过全美 指责政府,抨击总统,亡国论的书 可以随意流行

接触倒是接触过 呆过四五年吧

感觉他们还是满谦虚的,就事论事,当然上升到两国之间 意识形态差异,肯定是各看不惯各
发表于 2018-6-14 12:26 | 显示全部楼层
emu10kx 发表于 2018-6-14 12:06
不对  是美国人都给洗脑洗傻了

嗯 这倒是,,两国意识形态差异,都在放渗透,各看不惯各 倒是有的
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

小黑屋|手机版|Archiver|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806

GMT+8, 2018-9-25 09:21 , Processed in 0.061239 second(s), 12 queries , Gzip On, MemCache On.

Powered by Discuz! X3.1

© 2007-2017 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表