我輩樹である 发表于 2023-8-18 00:41

本帖最后由 我輩樹である 于 2023-8-18 00:46 编辑

coconutgallo 发表于 2023-8-17 23:30
之前各种官方参数都说只砍带宽,怎么现在大家都说fp64也阉了

查了下好像确实没砍。但只是网上的资料,不知道有没有人实际跑一下看看。

砍的是A800,砍了30%。

coconutgallo 发表于 2023-8-18 01:05

我輩樹である 发表于 2023-8-18 00:41
查了下好像确实没砍。但只是网上的资料,不知道有没有人实际跑一下看看。

砍的是A800,砍了30%。 ...

迷糊了,外网零星都只说了带宽,看看国内最近蛮多说砍计算的但是大多数没有数据,看到有一个商家网站写的单精度67T双精度1T[震惊]
http://www.cloudhin.com/xk/showproduct.php?id=293

lmeva2002 发表于 2023-8-18 02:32

liu3yang3715 发表于 2023-8-17 15:11
真是流口水,虽然这个电费个人用户可能就受不了了。

个人用户也用不上

赫敏 发表于 2023-8-18 02:48

jcd_chh 发表于 2023-8-16 21:53
厉害啊

老黄不厚道,H800双精度砍得妈都不认识

要这个的也不用双精度啊。现在半精度或者1/4精度算力比双精度值钱多了

而且一般需要双精度的场合,迭代次数没那么多,所以更看重IO而不是算力。现在其实用纯cpu来算双精度恐怕比gpu更合适,现在cpu的内存带宽也起来了,但cpu和gpu之间的互联速度还是老大难

slan7777 发表于 2023-8-18 08:43

fairness 发表于 2023-8-17 18:34
双精度算力也要砍?不是只是限制互联带宽吗?

建议你去白宫问拜登

slan7777 发表于 2023-8-18 08:46

coconutgallo 发表于 2023-8-17 23:30
之前各种官方参数都说只砍带宽,怎么现在大家都说fp64也阉了

你说的官方是哪个官方?老黄亲口跟你说的吗?

sciwander 发表于 2023-8-18 08:47

issues 发表于 2023-8-17 10:08
不明觉厉
我猜是H100

H800~~~~

coconutgallo 发表于 2023-8-18 09:36

slan7777 发表于 2023-8-18 08:46
你说的官方是哪个官方?老黄亲口跟你说的吗?

h800有几个月了吧。。。
https://lenovopress.lenovo.com/lp1732-thinksystem-nvidia-h100-h800-80gb-pcie-gen5-passive-gpu

银色的麦茬 发表于 2023-8-18 10:05

bei1991 发表于 2023-8-17 11:40
不算首批,六月初已经玩过了,还写了第一份测试报告。这次H800和H100差得有点多,算力有效率也很低,得等优 ...

老哥的测试报告在哪里能看吗?

Flanker 发表于 2023-8-18 12:05

coconutgallo 发表于 2023-8-18 09:36
h800有几个月了吧。。。

但是他这个表有问题,所有型号的cuda core数量都按完整gh100芯片144sm算了,tensor core数量又都按smx版算了

实际pcie版和smx版的cuda core和tensor core数量是不同的

fairness 发表于 2023-8-18 13:06

ooff22 发表于 2023-8-18 00:12
年底国内大厂估计会有个大惊喜.

什么大惊喜,现在供货这么紧张; 要改善,也要等到明年下半年了吧。

bei1991 发表于 2023-8-21 11:42

银色的麦茬 发表于 2023-8-18 10:05
老哥的测试报告在哪里能看吗?

内部交流用的,抱歉。
页: 1 [2]
查看完整版本: 老黄的战术核武器到了