找回密码
 加入我们
搜索
      
查看: 8347|回复: 36

[显卡] 估计这就是GR102了 (RTX6090 GPU)

[复制链接]
发表于 2025-9-10 01:36 | 显示全部楼层 |阅读模式
本帖最后由 新加坡妖王 于 2025-9-10 01:39 编辑

9月9日周二,英伟达宣布新一代Rubin CPX芯片系统,专门针对AI视频生成和软件开发等大规模上下文处理任务,强化AI编码和视频处理能力,将与2026年底上市。
我为什么认为这块芯片很可能是GR102呢?因为这块芯片使用了128G GDDR7显存
NVIDIA一般计算卡使用HBM显存,比如A100 H100 B200,图形卡(大家所说的游戏卡)用GDDR显存,而嵌入式SOC使用LPDDR内存,比如Orin、Thor。
NVIDIA不大可能单独为Rubin CPX单独流一块芯片(毕竟规模这么大),很可能和GR102是同一块芯片,最好的die给Rubin CPX,次一点的给RTX Pro 6000 Rubin,再差一点的给RTX6090。
这块芯片工艺预计是TSMC 3N(N3E或N3P工艺),从NVIDIA公布的图片和参数上看:
1.这块芯片仍然是单芯片设计
2.16GPC 192SM(12SM per GPC),算力为30PFLOPS NVFP4(B200的算力为40PFLOPS NVFP4)
3.显存控制器为512bit GDDR7,搭配双面32Gb GDDR7颗粒实现128G显存
4. 4*NVENC+4*NVDEC

RUBIN_CPX

RUBIN_CPX

评分

参与人数 1邪恶指数 +5 收起 理由
Barcelona + 5

查看全部评分

 楼主| 发表于 2025-9-10 09:30 | 显示全部楼层
皇冠3.0L 发表于 2025-9-10 09:27
RTX6090最多48G,大概率维持32G

RTX6090应该是36G 384bit GDDR7~48G 512bit GDDR7
 楼主| 发表于 2025-9-10 10:11 | 显示全部楼层
关于GR102(Rubin CPX GPU)的参数推测
GR102推测.png
 楼主| 发表于 2025-9-10 10:15 | 显示全部楼层
Rubin CPX dieshot分析
rubin_cpx_dieshot分析.png
 楼主| 发表于 2025-9-10 10:50 | 显示全部楼层
其实现在RTX4090、RTX5090应该不叫游戏卡了,叫图形卡比较好(和阉割图形功能的计算卡不一样)。毕竟AI兴起后,买RTX4090、RTX5090的大多数还是用来跑AI的,玩游戏的只是少数。
90级图形卡给跑AI提供一个比较廉价的选择,所以RTX6090会出的。
GR102最好的估计给Rubin CPX系统用,单块GPU阉割比较少或者不阉割,给128G GDDR7显存,甚至可能有NVLINK功能。
次一点的给RTX Pro 6000 Rubin用,估计180~192SM,给 96/128G 512bit GDDR7显存。
再差的给RTX6090用,估计164~180SM,给36G 384bit~48G 512bit GDDR7显存,不支持NVLINK。
硅渣给RTX6090D、RTX Pro 5880 Rubin用,满足中国区合规需求

Rubin CPX于2026年底上市,估计RTX6090应该也在2026年Q4吧
 楼主| 发表于 2025-9-15 17:17 | 显示全部楼层
本帖最后由 新加坡妖王 于 2025-9-15 17:30 编辑
PolyMorph 发表于 2025-9-15 14:11
30pf算力,应该牺牲了一些图形单元?


应该是把raster engine(包含rops)和3d ff砍掉了,增强了tensor core。
NVIDIA给的dieshot中,Rubin CPX的TPC比GB202的TPC面积大15~20%,如果Rubin CPX是TSMC 3nm,那么Rubin CPX的TPC比GB202的TPC晶体管数量高60~80%.
Rubin CPX 稀疏化FP4算力高达30PF,假如RTX60系和Rubin CPX架构完全一样,那么RTX6060(规模是Rubin CPX的1/6~1/7)的稀疏化FP4算力高达4~5PF,比RTX5090还高,意味着RTX6060全系在中国会禁售。
所以GR203~GR207(RTX6080~RTX6050)的Tensor Core和Rubin CPX肯定不一样,不会把Tensor Core堆那么高的,游戏卡用不到那么高的稀疏化FP4算力。
目前显卡的稀疏化FP4算力对游戏卡来说是过剩的,RTX5090 (3.3PF稀疏化FP4)和RTX5090D v1(2.2PF稀疏化FP4)游戏性能几乎一样就可以说明这一点。GR203~GR207堆那么高的稀疏化FP4算力,不仅对游戏、渲染来说远远过剩,而且为了合规会很麻烦。
 楼主| 发表于 2025-9-15 17:32 | 显示全部楼层
Barcelona 发表于 2025-9-15 14:15
重要的是,6080能给多少

估计不超过96SM,游戏性能提升25~35%,算力保证合规
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-11-4 20:36 , Processed in 0.009730 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表