我大概猜到50系GPU和显卡的规格了

新加坡妖王 · 发表于 2023-9-18 23:55

1. 单个SM传统结构不变，还是64*INT32/FP32+FP32（每SM 128CUDA），可能内部有一些微调，Tensor Core和RT Core进化一代，频率提升15%
2. 单个GPC提升到8TPC（16SM）、32 ROPs
3. 初期产品使用GDDR6X，单颗4G，后期可能会使用高频GDDR6X或GDDR7
4. 高端GPU（GB202、GB203）使用TSMC N3工艺，出的会早一些，中低端GPU使用TSMC N4P/N4X或3GAP工艺，出的会迟一些
5. GB202规模很大，但可能不给GeForce显卡用，而是面向利润更高的Quadro或计算卡

新加坡妖王 · 发表于 2023-9-19 00:01

参考依据：GB202相对RTX4090的规模提升
基础架构不动，ROPs翻倍，GPC结构改变
50% 规模提升（192SM，24576SP）
52% 带宽提升（512bit 24Gbps GDDR6X）
78% L2缓存提升（128M L2）
15% 频率提升
1.7x 综合提升（频率提升*规模提升）
考虑到ROPs翻倍，可以推测单GPC提升到32ROPs，GB202共12GPC，192SM，每GPC包含16SM

新加坡妖王 · 发表于 2023-9-19 00:02

RTX50显卡也预测一下吧

新加坡妖王 · 发表于 2023-9-19 00:16

JP_ToKyo 发表于 2023-9-19 00:07
老黃刀法如瘟神..會不會給這麼多顯存丫....

50系显存应该是单颗32bit 4G，128bit就是16G，不像40系单颗2G，128bit上16G需要双面显存。
AI对显存的需求也会促使显存厂商开发4G（32Gb）的显存颗粒，GDDR6 SPEC规定GDDR6有8Gb、12Gb、16Gb、24Gb、32Gb标准，目前GDDR6单颗最高2G（16Gb）还是因为AI兴起前对显存需求没那么高。
显卡的性能也需要与显存容量相匹配，比如RTX5070，TS都22W多，接近RTX4070Ti了，但位宽只有128bit，只有16G显存才能与之相匹配。

新加坡妖王 · 发表于 2023-9-19 00:23

关于显存问题：
柯基说GB202可能赶不上GDDR7，大概率还是GDDR6X，推测GB202很可能是GDDR6X、GDDR7双模显存控制器
三星电子宣布已完成其业内首款GDDR7的研发工作，年内将首先搭载于主要客户的下一代系统上验证，可以表明支持GDDR7的GPU已经流片，GDDR7也即将量产
至于GB202为什么大概率还是GDDR6X，原因可能是GB202会面向AI用户大批量出货，GDDR7产能届时可能无法满足GB202显卡大批量出货的需求，所以还是求稳，用GDDR6X，后期可能会上高频GDDR6X或GDDR7
GB205、GB206、GB207的显卡推出会迟一些，并且需求没有GB202那么大，GDDR7产能可以满足，用GDDR7没问题

新加坡妖王 · 发表于 2023-9-19 08:06

chungexcy 发表于 2023-9-19 08:00
6TPC效率已经堪忧了，8TPC我看还能怎么玩

6TPC效率低的原因是每个GPC里只有16ROPs，但单GPC提升到32ROPs，8TPC效率会更高

新加坡妖王 · 发表于 2023-9-19 12:15

ylgtx 发表于 2023-9-19 10:55
从40系现在的cuda数量看，4090的16384个已经是严重瓶颈了，单个cuda效率很低，50系还能不改架构继续堆下去 ...

4090瓶颈估计一是AD102的12GPC（4090可能是11GPC），GPU的前端有些跟不上了，并且缓存也只有72M，二是单GPC只有16ROPs，带12SM有些费劲，导致效率下降

新加坡妖王 · 发表于 2023-9-19 12:23

Flanker 发表于 2023-9-19 08:37
gddr6x美光独家，谁帮他研发32Gb的颗粒？

顺便老黄要谢谢你帮他挤牙膏了，5090就这b规格？ ...

提升颗粒容量其实并不难，关键在于有没有需求
另外，由于AI的需求，三星、镁光、海力士已经开始推出24Gb、32Gb的DDR5、LPDDR5颗粒，显存应该也会跟进，推出32Gb的GDDR6X、GDDR7颗粒

新加坡妖王 · 发表于 2023-9-19 18:07

goddog 发表于 2023-9-19 12:43
四零六零系谁也不敢想老黄性能倒吸价格暴涨，会不会5060性能比4060性能更低价格更贵呢？ ...

别尬黑，40系只是中低端挤牙膏，没有性能倒吸价格暴涨的
4060（299$）性能相对3060 12G（329$）提升20%多
4060Ti性能相对3060Ti（都是399$）提升15%，
4070（599$）性能相对3070（499$）提升29%
而且就算按同时期的价格相比，40系的性价比也不比同期的30系低，基本上持平或略高
50系估计也是这情况，性价比比同期的40系持平或略高

新加坡妖王 · 发表于 2023-9-19 19:56

Wurenji 发表于 2023-9-19 18:21
感觉面向AI的型号可能会用GDDR6W显存，单颗64bit，PCB结构可以更简单，同时能提升每个颗粒的带宽，一看就特 ...

GDDR6W只有三星有，而且还不是JEDEC的标准
GDDR6W是三星把两颗GDDR6颗粒封装在一起的产物，目前有32Gb X64位宽的版本，也就是把两颗16Gb X32的显存封装在一起，每颗显存各用一个X32 channel。面向移动端和嵌入式显卡，以减小封装面积，甚至可以把显卡做到苹果M1那样的大小。
接下来可能有32Gb X32位宽的版本，也就是两颗16Gb X32的显存，为了提高单颗的容量，用于在32Gb颗粒出来前的大显存显卡方案的过渡。
总带宽是无法提高的。

账号		自动登录	找回密码
密码			加入我们

[显卡] 我大概猜到50系GPU和显卡的规格了