GR102应该是chiplet，而且有可能是2*GR103

新加坡妖王 发表于 2025-7-31 23:34

先看这十年的NVIDIA旗舰GPU规格：
10系（Pascal）
GP102：6GPC，60SM，384bit GDDR5X
对应的显卡：P6000，FP32算力12.63TFLOPS，显存带宽432.8GB/s
20系（Turing）
TU102：6GPC，72SM，384bit GDDR6。核心规模+20%，改用GDDR6显存，新增Tensor Core和RT Core。
对应的显卡：TITAN RTX，FP32算力16.31TFLOPS（+29.1%），显存带宽672GB/s（+55.3%）。
30系（Ampere）
GA102：7GPC，84SM，384bit GDDR6X。核心规模+16.7%，支持GDDR6X显存，FP32翻倍。
对应的显卡：RTX3090Ti，FP32算力40TFLOPS（不考虑FP32翻倍就是+22.6%），显存带宽1010GB/s（+50.3%）。
40系（Ada Lovelace），老黄手上有钱了，打了最大的富裕仗
AD102：12GPC，144SM，384bit GDDR6X。核心规模+71.4%，Tensor Core史诗级加强。
对应的显卡：RTX 6000 Ada，FP32算力91.06TFLOPS（+126.7%），显存带宽1000GB/s（+0%）。
50系（Blackwell），优化AI算力的PPA，改用GDDR7显存
对应的显卡：RTX PRO 6000 Blackwell，FP32算力126TFLOPS（+38.4%），显存带宽1790GB/s（+79%）。

这几代旗舰GPU在AI的驱动下，再加上老黄手上越来越有钱，每一代的规模（当然价格也是）提升幅度很大。Rubin（60系）的GR102提升幅度应该还会比较高，但因为工艺的原因，AD102这种提升幅度应该是不可能了，而且GR102肯定还是GDDR7显存，显存带宽不会有很大的提升（最多28Gbps到34Gbps，提升21.4%），但也不可能回到384bit，应该还是512bit GDDR7。
GR102预计使用TSMC 3N（N3E或N3P的定制化工艺），因为成本比较高，所以很大可能是2个GR103组成chiplet，使用硅桥连接两个Die，类似苹果M Max。这种硅桥连接两个Die会导致GPU内部跨Die延迟，估计对游戏有影响，但对AI影响很小。
当然GR103很可能也是类似NAVI31、NAVI32这种chiplet，由GPUD、MCD、IOD（包含PCIE和显示PHY）组成。目前有消息（智慧芯片案内人）说Rubin有TSMC 3nm的GPUD和5nm的IOD（估计包括MCD）。
TSMC N3P相对TSMC N5P（TSMC 4N实际上是N5P）的频率提升大约15%左右。

新加坡妖王 发表于 2025-7-31 23:48

如果GR102=2*GR103

基于这种假设的基础上，推测GR102和GR103的规模：
GR103：7GPC，112SM（每个GPC包含8TPC，即16SM），256bit GDDR7+64M L2
GR102：14GPC，224SM，512bit GDDR7+128M L2。（核心规模+16.7%）
预测RTX Pro 6000 Rubin的规格：220SM @2980MHz（算力+33%），128G 512bit GDDR7 @34Gbps (带宽+21.4%）。
RTX6090可能会给个200~210SM，48G 512bit GDDR7。
RTX6080可能会给个106~112SM，24G 256bit GDDR7。
RTX6070Ti可能会给个88~92SM，24G 256bit GDDR7。

当然老黄如果想打富裕仗的话，GR102和GR103的规模会继续提高，代价是RTX6080和RTX6070Ti价格也一起起飞，且RTX6080可能面临禁售
GR103：8GPC，128SM，256bit GDDR7+64M L2
GR102：16GPC，256SM，512bit GDDR7+128M L2。（核心规模+33.3%）
预测RTX Pro 6000 Rubin的规格：252SM @2980MHz（算力+52.4%），128G 512bit GDDR7 @34Gbps (带宽+21.4%）。
RTX6090可能会给个230~240SM，48G 512bit GDDR7。
RTX6080可能会给个122~128SM，24G 256bit GDDR7。
RTX6070Ti可能会给个90~96SM，24G 256bit GDDR7。

新加坡妖王 发表于 2025-7-31 23:55

GR105、GR106、GR107就不用指望多大提升了，估计也就是常规提升（相对上一代提升一个层级），规格也预测一下：

GR105：5GPC，60SM，192bit GDDR7+48M L2。
RTX6070，预计60SM，18G 192bit GDDR7，图形性能相对RTX5070增加35%左右。
RTX6060Ti，预计44SM，15G 160bit GDDR7，图形性能相对RTX5060Ti增加45%左右。

GR106：3GPC，36SM，128bit GDDR7+32M L2。
RTX6060，预计32SM，12G 128bit GDDR7，图形性能相对RTX5060增加20%左右。

GR107（不一定有）：2GPC，24SM，96bit GDDR7+16/24M L2。
RTX6050（不一定有），预计24SM，9G 96bit GDDR7，图形性能相对RTX5050增加30%左右。

用户发表于 2025-7-31 23:57

本帖最后由用户于 2025-8-1 00:00 编辑

现在能耗比不提升，显卡要1000多瓦了。规模越大功耗越高。

老黄在tsmc那产能有限，AI卡需求又高，设计时候必然会缩小面积但牺牲功耗。对AI卡倒还好，10万块钱的卡也不差那点电费了。游戏、个人用户可是遭罪了。

新加坡妖王 发表于 2025-8-1 00:01

用户发表于 2025-7-31 23:57
现在能耗比不提升，显卡要1000多瓦了。规模越大功耗越高。

台积电3nm能效、密度、性能相对5nm提升都挺大的。
其实NVIDIA做过4槽版的RTX Titan Ada的模具，功耗600W，但因为AD102能效提升实在是巨大，就没有用这个模具。
接下来旗舰显卡继续堆规模的话，可能就会把这个模具拿出来，优化一下风道和散热，把功耗拉到800W甚至1000W都有可能。

LOLI反应堆 发表于 2025-8-1 00:24

想peach。我猜测GR202回到384bit，前端甚至倒吸。
GR203规格原地踏步，提升靠IPC+频率，只要提升25%略胜4090就行了。
GR204要下点功夫，毕竟5070被对位的吊打了，这部分差距要赶回来，60SM\192bit 18GB，性能~5070Ti+5%。
GR206原地踏步没毛病。
GR207啃腚有。

[恶魔]

aozorahishi 发表于 2025-8-1 10:14

LOLI反应堆发表于 2025-8-1 00:24
想peach。我猜测GR202回到384bit，前端甚至倒吸。
GR203规格原地踏步，提升靠IPC+频率，只要提升25%略胜409 ...

GR102 103肯定要提升规格，但不是给你们臭打游戏提的

qiuhepeng 发表于 2025-8-1 10:19

LOLI反应堆发表于 2025-8-1 00:24
想peach。我猜测GR202回到384bit，前端甚至倒吸。
GR203规格原地踏步，提升靠IPC+频率，只要提升25%略胜409 ...

50super到底还有没有啊

gartour 发表于 2025-8-1 10:27

老黄搞得cowop也是为了这个吧，不过有分析说挑战比较大，可能赶不上下一代。

foxlive117 发表于 2025-8-1 16:09

6090，600w左右功耗下真实硬实力能比5090强30%我就满意了，必换，不过还是更希望能像ad102那样放卫星般的提升，台积电2/3nm，看你的了[偷笑]

BioWeapon_Re 发表于 2025-8-2 02:45

我来猜一个[偷笑]
GR203 680~735亿晶体管 350~400mm2
10GPC 120SM 15360cuda
256bit 24G 38Gbps GDDR7
96M L2缓存
核心峰值频率2.95Ghz 90T fp32
375w TGP

RTX6080 GR203-300
112SM 14336cuda
256bit 24G 36Gbps GDDR7
84M L2缓存
核心峰值频率2.97GHZ 85T fp32
360w TGP
[狂笑]

改进架构，IPC进步15~20%，我猜6080可以接近甚至略微超过5090的性能[狂笑]

页: [1]

Chiphell - 分享与交流用户体验's Archiver

GR102应该是chiplet，而且有可能是2*GR103