找回密码
 加入我们
搜索
      
查看: 16100|回复: 34

[显卡] 很多人没明白英伟达能用TSMC 5nm做出多强的卡

[复制链接]
发表于 2022-9-9 23:43 | 显示全部楼层 |阅读模式
A100白皮书 https://images.nvidia.com/aem-dam/en-zz/Solutions/data-center/nvidia-ampere-architecture-whitepaper.pdf
GA102白皮书 https://www.nvidia.com/content/PDF/nvidia-ampere-ga-102-gpu-architecture-whitepaper-v2.pdf
H100白皮书 https://resources.nvidia.com/en-us-tensor-core

以下所有数据和内容均出自于上面三分白皮书,简单点说就是H100两个版本。完全体SXM5性能是3.1x A100,规模是2.5x。功耗1.75x,缩水体也可以做到PCIe性能是A100 2.5x,规模2.1x,功耗0.88x



我引用一下原话就是
3x faster IEEE FP64 and FP32 processing rates chip-to-chip compared to A100, due to 2x faster clock-for-clock performance per SM, plus additional SM counts and higher clocks of H100.



从CUDA规模上看,GA102的sm单元是A100的1/2(多个RT core),而A100又是H100的1/2。H100还有PCIe5.0,HBM3e,这些不会用游戏卡上的暂且不提。

也就是说7nm->5nm,老黄可以做出了同功耗理论性能2.5x+的卡。那么samsung 8nm->5nm,你不用大脑就能想到老黄性能上压制AMD不是能不能的事情,而是想不想的事情。现在不管什么传言,ada lovelace高功耗也好,以及之前GH下放也罢。只要老黄想,规模做到GA102直接2x+,再加上频率1.5x,这是毫无难度,这性能提升绝对比ampere相比turing大了多。

我黄只是给苏妈留点面子,不想赢了那么多,旗舰只要象征性稍微赢点就行了,然后定格高价,愿者上钩,走量还是靠下面的60/70。也不知道RNDA3究竟如何,大家都要赚钱,所以向来精准的刀法需要一定地酝酿,免得你们这群打游戏的说我老黄老了,刀法不行。面对vega整出个1080ti纯属没必要
 楼主| 发表于 2022-9-10 01:21 | 显示全部楼层
qiu95 发表于 2022-9-10 01:08
楼主有一些认识偏差,首先比较tensor core的性能对于游戏计算来说是没有意义的,tensor core的执行主要是对 ...

这不是GA102和A100的横向比较,两者本来就不具备可比性,我自然知道3090 FP32 39T。这里比的是H100和A100,除了显存容量不变,一次工艺变更,从FP8->FP64全方位3X性能提升,而不是拆东墙补西墙式的提升。说了直白点就是老黄不计成本游戏卡至少能做到3X+理论性能提升,因为samsung 8nm远不如tmsc 7nm。
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-7-16 20:32 , Processed in 0.008435 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表