coconutgallo 发表于 2023-8-17 23:30
之前各种官方参数都说只砍带宽,怎么现在大家都说fp64也阉了
查了下好像确实没砍。但只是网上的资料,不知道有没有人实际跑一下看看。
砍的是A800,砍了30%。 我輩樹である 发表于 2023-8-18 00:41
查了下好像确实没砍。但只是网上的资料,不知道有没有人实际跑一下看看。
砍的是A800,砍了30%。 ...
迷糊了,外网零星都只说了带宽,看看国内最近蛮多说砍计算的但是大多数没有数据,看到有一个商家网站写的单精度67T双精度1T[震惊]
http://www.cloudhin.com/xk/showproduct.php?id=293 liu3yang3715 发表于 2023-8-17 15:11
真是流口水,虽然这个电费个人用户可能就受不了了。
个人用户也用不上 jcd_chh 发表于 2023-8-16 21:53
厉害啊
老黄不厚道,H800双精度砍得妈都不认识
要这个的也不用双精度啊。现在半精度或者1/4精度算力比双精度值钱多了
而且一般需要双精度的场合,迭代次数没那么多,所以更看重IO而不是算力。现在其实用纯cpu来算双精度恐怕比gpu更合适,现在cpu的内存带宽也起来了,但cpu和gpu之间的互联速度还是老大难 fairness 发表于 2023-8-17 18:34
双精度算力也要砍?不是只是限制互联带宽吗?
建议你去白宫问拜登 coconutgallo 发表于 2023-8-17 23:30
之前各种官方参数都说只砍带宽,怎么现在大家都说fp64也阉了
你说的官方是哪个官方?老黄亲口跟你说的吗? issues 发表于 2023-8-17 10:08
不明觉厉
我猜是H100
H800~~~~ slan7777 发表于 2023-8-18 08:46
你说的官方是哪个官方?老黄亲口跟你说的吗?
h800有几个月了吧。。。
https://lenovopress.lenovo.com/lp1732-thinksystem-nvidia-h100-h800-80gb-pcie-gen5-passive-gpu bei1991 发表于 2023-8-17 11:40
不算首批,六月初已经玩过了,还写了第一份测试报告。这次H800和H100差得有点多,算力有效率也很低,得等优 ...
老哥的测试报告在哪里能看吗? coconutgallo 发表于 2023-8-18 09:36
h800有几个月了吧。。。
但是他这个表有问题,所有型号的cuda core数量都按完整gh100芯片144sm算了,tensor core数量又都按smx版算了
实际pcie版和smx版的cuda core和tensor core数量是不同的 ooff22 发表于 2023-8-18 00:12
年底国内大厂估计会有个大惊喜.
什么大惊喜,现在供货这么紧张; 要改善,也要等到明年下半年了吧。 银色的麦茬 发表于 2023-8-18 10:05
老哥的测试报告在哪里能看吗?
内部交流用的,抱歉。
页:
1
[2]