找回密码
 加入我们
搜索
      
查看: 16750|回复: 44

[显卡] 我大概猜到50系GPU和显卡的规格了

[复制链接]
发表于 2023-9-18 23:55 | 显示全部楼层 |阅读模式
1. 单个SM传统结构不变,还是64*INT32/FP32+FP32(每SM 128CUDA),可能内部有一些微调,Tensor Core和RT Core进化一代,频率提升15%
2. 单个GPC提升到8TPC(16SM)、32 ROPs
3. 初期产品使用GDDR6X,单颗4G,后期可能会使用高频GDDR6X或GDDR7
4. 高端GPU(GB202、GB203)使用TSMC N3工艺,出的会早一些,中低端GPU使用TSMC N4P/N4X或3GAP工艺,出的会迟一些
5. GB202规模很大,但可能不给GeForce显卡用,而是面向利润更高的Quadro或计算卡
 楼主| 发表于 2023-9-19 00:01 | 显示全部楼层
参考依据:GB202相对RTX4090的规模提升
基础架构不动,ROPs翻倍,GPC结构改变
50% 规模提升(192SM,24576SP)
52% 带宽提升(512bit 24Gbps GDDR6X)
78% L2缓存提升(128M L2)
15% 频率提升
1.7x 综合提升(频率提升*规模提升)
考虑到ROPs翻倍,可以推测单GPC提升到32ROPs,GB202共12GPC,192SM,每GPC包含16SM

GB20X系列预测

GB20X系列预测
 楼主| 发表于 2023-9-19 00:02 | 显示全部楼层
RTX50显卡也预测一下吧
RTX50.png
 楼主| 发表于 2023-9-19 00:16 | 显示全部楼层
JP_ToKyo 发表于 2023-9-19 00:07
老黃刀法如瘟神..會不會給這麼多顯存丫....

50系显存应该是单颗32bit 4G,128bit就是16G,不像40系单颗2G,128bit上16G需要双面显存。
AI对显存的需求也会促使显存厂商开发4G(32Gb)的显存颗粒,GDDR6 SPEC规定GDDR6有8Gb、12Gb、16Gb、24Gb、32Gb标准,目前GDDR6单颗最高2G(16Gb)还是因为AI兴起前对显存需求没那么高。
显卡的性能也需要与显存容量相匹配,比如RTX5070,TS都22W多,接近RTX4070Ti了,但位宽只有128bit,只有16G显存才能与之相匹配。
 楼主| 发表于 2023-9-19 00:23 | 显示全部楼层
关于显存问题:
柯基说GB202可能赶不上GDDR7,大概率还是GDDR6X,推测GB202很可能是GDDR6X、GDDR7双模显存控制器
三星电子宣布已完成其业内首款GDDR7的研发工作,年内将首先搭载于主要客户的下一代系统上验证,可以表明支持GDDR7的GPU已经流片,GDDR7也即将量产
至于GB202为什么大概率还是GDDR6X,原因可能是GB202会面向AI用户大批量出货,GDDR7产能届时可能无法满足GB202显卡大批量出货的需求,所以还是求稳,用GDDR6X,后期可能会上高频GDDR6X或GDDR7
GB205、GB206、GB207的显卡推出会迟一些,并且需求没有GB202那么大,GDDR7产能可以满足,用GDDR7没问题
 楼主| 发表于 2023-9-19 08:06 | 显示全部楼层
chungexcy 发表于 2023-9-19 08:00
6TPC效率已经堪忧了,8TPC我看还能怎么玩

6TPC效率低的原因是每个GPC里只有16ROPs,但单GPC提升到32ROPs,8TPC效率会更高
 楼主| 发表于 2023-9-19 12:15 | 显示全部楼层
ylgtx 发表于 2023-9-19 10:55
从40系现在的cuda数量看,4090的16384个已经是严重瓶颈了,单个cuda效率很低,50系还能不改架构继续堆下去 ...

4090瓶颈估计一是AD102的12GPC(4090可能是11GPC),GPU的前端有些跟不上了,并且缓存也只有72M,二是单GPC只有16ROPs,带12SM有些费劲,导致效率下降
 楼主| 发表于 2023-9-19 12:23 | 显示全部楼层
Flanker 发表于 2023-9-19 08:37
gddr6x美光独家,谁帮他研发32Gb的颗粒?

顺便老黄要谢谢你帮他挤牙膏了,5090就这b规格? ...

提升颗粒容量其实并不难,关键在于有没有需求
另外,由于AI的需求,三星、镁光、海力士已经开始推出24Gb、32Gb的DDR5、LPDDR5颗粒,显存应该也会跟进,推出32Gb的GDDR6X、GDDR7颗粒
 楼主| 发表于 2023-9-19 18:07 | 显示全部楼层
goddog 发表于 2023-9-19 12:43
四零六零系谁也不敢想老黄性能倒吸价格暴涨,会不会5060性能比4060性能更低价格更贵呢? ...

别尬黑,40系只是中低端挤牙膏,没有性能倒吸价格暴涨的
4060(299$)性能相对3060 12G(329$)提升20%多
4060Ti性能相对3060Ti(都是399$)提升15%,
4070(599$)性能相对3070(499$)提升29%
而且就算按同时期的价格相比,40系的性价比也不比同期的30系低,基本上持平或略高
50系估计也是这情况,性价比比同期的40系持平或略高
 楼主| 发表于 2023-9-19 19:56 | 显示全部楼层
Wurenji 发表于 2023-9-19 18:21
感觉面向AI的型号可能会用GDDR6W显存,单颗64bit,PCB结构可以更简单,同时能提升每个颗粒的带宽,一看就特 ...

GDDR6W只有三星有,而且还不是JEDEC的标准
GDDR6W是三星把两颗GDDR6颗粒封装在一起的产物,目前有32Gb X64位宽的版本,也就是把两颗16Gb X32的显存封装在一起,每颗显存各用一个X32 channel。面向移动端和嵌入式显卡,以减小封装面积,甚至可以把显卡做到苹果M1那样的大小。
接下来可能有32Gb X32位宽的版本,也就是两颗16Gb X32的显存,为了提高单颗的容量,用于在32Gb颗粒出来前的大显存显卡方案的过渡。
总带宽是无法提高的。
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-6-8 02:01 , Processed in 0.010975 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表