新加坡妖王 发表于 2025-7-31 23:34

GR102应该是chiplet,而且有可能是2*GR103

先看这十年的NVIDIA旗舰GPU规格:
10系(Pascal)
GP102:6GPC,60SM,384bit GDDR5X
对应的显卡:P6000,FP32算力12.63TFLOPS,显存带宽432.8GB/s
20系(Turing)
TU102:6GPC,72SM,384bit GDDR6。核心规模+20%,改用GDDR6显存,新增Tensor Core和RT Core。
对应的显卡:TITAN RTX,FP32算力16.31TFLOPS(+29.1%),显存带宽672GB/s(+55.3%)。
30系(Ampere)
GA102:7GPC,84SM,384bit GDDR6X。核心规模+16.7%,支持GDDR6X显存,FP32翻倍。
对应的显卡:RTX3090Ti,FP32算力40TFLOPS(不考虑FP32翻倍就是+22.6%),显存带宽1010GB/s(+50.3%)。
40系(Ada Lovelace),老黄手上有钱了,打了最大的富裕仗
AD102:12GPC,144SM,384bit GDDR6X。核心规模+71.4%,Tensor Core史诗级加强。
对应的显卡:RTX 6000 Ada,FP32算力91.06TFLOPS(+126.7%),显存带宽1000GB/s(+0%)。
50系(Blackwell),优化AI算力的PPA,改用GDDR7显存
对应的显卡:RTX PRO 6000 Blackwell,FP32算力126TFLOPS(+38.4%),显存带宽1790GB/s(+79%)。

这几代旗舰GPU在AI的驱动下,再加上老黄手上越来越有钱,每一代的规模(当然价格也是)提升幅度很大。Rubin(60系)的GR102提升幅度应该还会比较高,但因为工艺的原因,AD102这种提升幅度应该是不可能了,而且GR102肯定还是GDDR7显存,显存带宽不会有很大的提升(最多28Gbps到34Gbps,提升21.4%),但也不可能回到384bit,应该还是512bit GDDR7。
GR102预计使用TSMC 3N(N3E或N3P的定制化工艺),因为成本比较高,所以很大可能是2个GR103组成chiplet,使用硅桥连接两个Die,类似苹果M Max。这种硅桥连接两个Die会导致GPU内部跨Die延迟,估计对游戏有影响,但对AI影响很小。
当然GR103很可能也是类似NAVI31、NAVI32这种chiplet,由GPUD、MCD、IOD(包含PCIE和显示PHY)组成。目前有消息(智慧芯片案内人)说Rubin有TSMC 3nm的GPUD和5nm的IOD(估计包括MCD)。
TSMC N3P相对TSMC N5P(TSMC 4N实际上是N5P)的频率提升大约15%左右。

新加坡妖王 发表于 2025-7-31 23:48

如果GR102=2*GR103

基于这种假设的基础上,推测GR102和GR103的规模:
GR103:7GPC,112SM(每个GPC包含8TPC,即16SM),256bit GDDR7+64M L2
GR102:14GPC,224SM,512bit GDDR7+128M L2。(核心规模+16.7%)
预测RTX Pro 6000 Rubin的规格:220SM @2980MHz(算力+33%),128G 512bit GDDR7 @34Gbps (带宽+21.4%)。
RTX6090可能会给个200~210SM,48G 512bit GDDR7。
RTX6080可能会给个106~112SM,24G 256bit GDDR7。
RTX6070Ti可能会给个88~92SM,24G 256bit GDDR7。

当然老黄如果想打富裕仗的话,GR102和GR103的规模会继续提高,代价是RTX6080和RTX6070Ti价格也一起起飞,且RTX6080可能面临禁售
GR103:8GPC,128SM,256bit GDDR7+64M L2
GR102:16GPC,256SM,512bit GDDR7+128M L2。(核心规模+33.3%)
预测RTX Pro 6000 Rubin的规格:252SM @2980MHz(算力+52.4%),128G 512bit GDDR7 @34Gbps (带宽+21.4%)。
RTX6090可能会给个230~240SM,48G 512bit GDDR7。
RTX6080可能会给个122~128SM,24G 256bit GDDR7。
RTX6070Ti可能会给个90~96SM,24G 256bit GDDR7。

新加坡妖王 发表于 2025-7-31 23:55

GR105、GR106、GR107就不用指望多大提升了,估计也就是常规提升(相对上一代提升一个层级),规格也预测一下:

GR105:5GPC,60SM,192bit GDDR7+48M L2。
RTX6070,预计60SM,18G 192bit GDDR7,图形性能相对RTX5070增加35%左右。
RTX6060Ti,预计44SM,15G 160bit GDDR7,图形性能相对RTX5060Ti增加45%左右。

GR106:3GPC,36SM,128bit GDDR7+32M L2。
RTX6060,预计32SM,12G 128bit GDDR7,图形性能相对RTX5060增加20%左右。

GR107(不一定有):2GPC,24SM,96bit GDDR7+16/24M L2。
RTX6050(不一定有),预计24SM,9G 96bit GDDR7,图形性能相对RTX5050增加30%左右。

用户 发表于 2025-7-31 23:57

本帖最后由 用户 于 2025-8-1 00:00 编辑

现在能耗比不提升,显卡要1000多瓦了。规模越大功耗越高。

老黄在tsmc那产能有限,AI卡需求又高,设计时候必然会缩小面积但牺牲功耗。对AI卡倒还好,10万块钱的卡也不差那点电费了。游戏、个人用户可是遭罪了。

新加坡妖王 发表于 2025-8-1 00:01

用户 发表于 2025-7-31 23:57
现在能耗比不提升,显卡要1000多瓦了。规模越大功耗越高。

台积电3nm能效、密度、性能相对5nm提升都挺大的。
其实NVIDIA做过4槽版的RTX Titan Ada的模具,功耗600W,但因为AD102能效提升实在是巨大,就没有用这个模具。
接下来旗舰显卡继续堆规模的话,可能就会把这个模具拿出来,优化一下风道和散热,把功耗拉到800W甚至1000W都有可能。

LOLI反应堆 发表于 2025-8-1 00:24

想peach。我猜测GR202回到384bit,前端甚至倒吸。
GR203规格原地踏步,提升靠IPC+频率,只要提升25%略胜4090就行了。
GR204要下点功夫,毕竟5070被对位的吊打了,这部分差距要赶回来,60SM\192bit 18GB,性能~5070Ti+5%。
GR206原地踏步没毛病。
GR207啃腚有。

[恶魔]

aozorahishi 发表于 2025-8-1 10:14

LOLI反应堆 发表于 2025-8-1 00:24
想peach。我猜测GR202回到384bit,前端甚至倒吸。
GR203规格原地踏步,提升靠IPC+频率,只要提升25%略胜409 ...

GR102 103肯定要提升规格,但不是给你们臭打游戏提的

qiuhepeng 发表于 2025-8-1 10:19

LOLI反应堆 发表于 2025-8-1 00:24
想peach。我猜测GR202回到384bit,前端甚至倒吸。
GR203规格原地踏步,提升靠IPC+频率,只要提升25%略胜409 ...

50super到底还有没有啊

gartour 发表于 2025-8-1 10:27

老黄搞得cowop也是为了这个吧,不过有分析说挑战比较大,可能赶不上下一代。

foxlive117 发表于 2025-8-1 16:09

6090,600w左右功耗下真实硬实力能比5090强30%我就满意了,必换,不过还是更希望能像ad102那样放卫星般的提升,台积电2/3nm,看你的了[偷笑]

BioWeapon_Re 发表于 2025-8-2 02:45

我来猜一个[偷笑]
GR203 680~735亿晶体管 350~400mm2
10GPC 120SM 15360cuda
256bit 24G 38Gbps GDDR7
96M L2缓存
核心峰值频率2.95Ghz 90T fp32
375w TGP

RTX6080 GR203-300
112SM 14336cuda
256bit 24G 36Gbps GDDR7
84M L2缓存
核心峰值频率2.97GHZ 85T fp32
360w TGP
[狂笑]

改进架构,IPC进步15~20%,我猜6080可以接近甚至略微超过5090的性能[狂笑]
页: [1]
查看完整版本: GR102应该是chiplet,而且有可能是2*GR103