找回密码
 加入我们
搜索
      
查看: 10452|回复: 45

[显卡] NVIDIA 官方实锤:5090 的光栅性能瓶颈完全在 ROPs 上

[复制链接]
发表于 2025-2-23 14:58 | 显示全部楼层
黄卡rops的配置从maxwell开始就没变
前端是gpc输出瓶颈,后端rop(早期和显存控制器绑定,著名的970 3.5G)

一个gpc输出16bit
早年GM200是一个gpc含8个tpc 共6个gpc
到GP102改为一个gpc含10个tpc 也是6个gpc
到GA102改为一个gpc含12个tpc 加到7个gpc
AD102维持一个gpc含12个tpc 加到12个gpc。但是这时候的光栅瓶颈已经很显著了。
GB202改为一个gpc含16个tpc 维持12个gpc。进一步加剧rop瓶颈,而且也无法充分利用显存带宽。

整个blackwell架构用了GD7,却没有匹配整个后端图形输出,也许老黄觉得加晶体管堆rop已经没有合适的收益了,摆烂就行。
特别是GB202就是为了非图形目的而去的
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-7-7 14:10 , Processed in 0.007456 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表