找回密码
 加入我们
搜索
      
查看: 9519|回复: 46

[显卡] Blackwell GPU规格和架构猜测

[复制链接]
发表于 2024-3-11 14:06 | 显示全部楼层 |阅读模式
目前已知的消息,GB202,12GPC,192SM,24576CUDA,384bit GDDR7,(128M L2?),那就先从GB202开始说。
一、架构方面:
1.Blackwell GPU架构的改进好像是单个SM的ALU分为ALUH和ALUL,还是128CUDA,但效率会提升。
2.单个GPC从12SM+16ROPs提升到16SM+32ROPs,由于ROPs:SM的比例更高,SM单元的效率会提升。并且相同SM数量的大规模显卡所需的GPC减小,效率也会提高。
3.由于20系到30系主要提升点是SM单元FP32翻倍,30系到40系主要提升点是AI(Tensor Core)暴增,40系到50系主要提升点应该是光追(RT Core)。
二、IO和CACHE方面:
1.GB202使用的是384bit GDDR7(来自VCZ)。
2.GB202 Cache未知,可能是96M或128M。Cache的带宽与IO速率和位宽相关,通常Cache越大,IO位宽越高,且Cache命中率越高,增加的带宽也越高,但会增加延迟,此外Cache也可以降低访存功耗。Cache的带宽提升也与控制电路和频率有关。
三、工艺方面
1.GB202的工艺应该是TSMC N3E,高频相当于Ada的TSMC N5P有10%~15%的提升,低频能效也会更好,且密度提升较高,但成本高很多。此外TSMC N3E的SRAM、IO密度几乎和TSMC N5P一样。
 楼主| 发表于 2024-3-11 14:07 | 显示全部楼层
GB202的面积预计620mm2左右
 楼主| 发表于 2024-3-11 14:09 | 显示全部楼层
GB203应该和GB202使用一样的工艺(TSMC N3E),但规模会低很多,面积大约380mm2左右。
GB203,7GPC,112SM,14336CUDA,256bit GDDR7,64M L2。
 楼主| 发表于 2024-3-11 14:17 | 显示全部楼层
GB205、GB206、GB207的定位就要低很多了。老黄没有做GB204,而是GB205就可以说明定位降级这一点。
1.架构方面会和GB202、GB203保持一致
2.IO和SRAM会砍不少,GB202、GB203有没有nvlink说不好(这东西可以提升多卡AI的效率),但GB205~GB207肯定没有。
3.工艺方面未必会用TSMC N3E,可能是三星3GAP(良品率低)或TSMC N4P(老工艺,不一定用)。但老黄也可以像苹果那样和TSMC谈,把TSMC N3E的代工成本降下去。
 楼主| 发表于 2024-3-11 14:17 | 显示全部楼层
natt 发表于 2024-3-11 14:11
这次是大核心还是小核心互联?

GB202~GB207都是单芯片设计,GB100是chiplet
 楼主| 发表于 2024-3-11 14:22 | 显示全部楼层
GB205~GB207的规格和面积预测(工艺基于TSMC N3E)
GB205,5GPC,80SM,10240CUDA,192bit GDDR7,48M L2,面积大约285mm2。
GB206,3GPC,48SM,6144CUDA,128bit GDDR7,32M L2,面积大约190mm2。
GB207,2GPC,32SM,4096CUDA,96bit GDDR7(可能是128bit GDDR6或GDDR7),24M L2,面积大约140mm2。
注:VCZ对GB207的预测是128bit,且NVIDIA在低端卡上有用上一代显存的历史,所以GB207可能是GDDR6。
 楼主| 发表于 2024-3-11 14:32 | 显示全部楼层
GB207如果用96bit GDDR7其实是好事。
96bit GDDR7带宽相当于192bit GDDR6,比128bit GDDR6X都高。
初代GDDR7只有16Gb的颗粒,RTX5060(GB207)如果是128bit GDDR6或GDDR7,那可能会出个8G的小显存版(4颗显存)恶心一下,再出个16G(8颗显存)卖高价。但如果是96bit的GDDR7,那一定是12G显存(6颗显存)。
告诉大家一个很多人不知道的秘密,GDDR7用双倍显存颗粒(单颗显存启用16bit IO),成本比GDDR6低很多,且适用于笔记本平台。
JEDEC在GDDR6 SPEC中要求双倍显存颗粒必须是双面显存,这会导致PCB板层数和复杂度增加,成本很高,此外双面显存颗粒积热严重,且不适用于笔记本平台。RX6500XT 8G只有4颗显存,显存都得是双面。
JEDEC在GDDR7 SPEC中要求双倍显存颗粒可以是单面(显存颗粒较少),也可以是双面,这样的话小位宽显卡用双倍显存颗粒成本就低很多了,且适用于笔记本平台。
幻灯片3.JPG
幻灯片7.JPG
 楼主| 发表于 2024-3-11 14:33 | 显示全部楼层
punk100 发表于 2024-3-11 14:19
感觉这个设计是为计算卡做了优化,以后老黄家新一代架构做计算卡,老一代架构做游戏卡。多好。 ...

必须的,计算卡和3D图形卡侧重点不一样
 楼主| 发表于 2024-3-11 18:37 | 显示全部楼层
atiufo 发表于 2024-3-11 17:31
他不是最近刚爆料gb20X的显存位宽和ada没什么区别么,我本来还对512bit gddr7心存一丝幻想,但幻想终究只 ...

但现在又说坚持认为GB202是512bit了
 楼主| 发表于 2024-3-11 18:42 | 显示全部楼层
panzerlied 发表于 2024-3-11 16:42
矿潮都在路上了,还在有的没的。

现在这些空气币还是算了吧
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-8-16 03:11 , Processed in 0.010019 second(s), 8 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表