Chiphell - 分享与交流用户体验

标题: Ada Lovelace vs Blackwell,略显诡异的测试结果。 [打印本页]

作者: panzerlied    时间: 2025-8-26 10:26
标题: Ada Lovelace vs Blackwell,略显诡异的测试结果。
一、测试条件

1、核心规格是一样的。

2、核心定频1500MHz。因条件限制,AD106显存降到16Gbps,GB206显存降到14Gbps,做不到完全同频。xbar的频率看起来是GB206更高,但是实测L2带宽还是AD106稍大一些。粗略当做L2和显存,AD106在此时的条件下等比例比GB206大一些。

3、所有3DMark项目,除了DXR,FSR2之外,都手动调整到1080P,关闭HDR。FSR2测试为1440P Performance档位。

4、驱动版本580.97。

二、参赛选手

1、AD106

(, 下载次数: 0)

2、GB206

(, 下载次数: 0)

三、测试成绩

(, 下载次数: 0)

四、没有分析
作者: chm128256    时间: 2025-8-26 10:29
大佬的意思是不是40系到50系的构架没啥大改进,基本上就是挤牙膏?
作者: gladiator    时间: 2025-8-26 10:32
Blackwell 2.0不是本质就是 Ada Lovelace 2.0或者说refresh么 提升主要是规模调整和G7显存带宽的加持
作者: foxlive117    时间: 2025-8-26 10:36
chm128256 发表于 2025-8-26 10:29
大佬的意思是不是40系到50系的构架没啥大改进,基本上就是挤牙膏?

鲁宾都快出了,你不会刚知道吧
作者: allensakura    时间: 2025-8-26 10:38
gladiator 发表于 2025-8-26 10:32
Blackwell 2.0不是本质就是 Ada Lovelace 2.0或者说refresh么 提升主要是规模调整和G7显存带宽的加持 ...

不是
更正确的说是跟AI没关的东西砍了一些,把AI有关的东西尽量加上
从架构到指令集全面提昇

但是新的格式.新的指令集.新的优化方式都不用上的话只能说一点提昇都没有

作者: chm128256    时间: 2025-8-26 10:38
foxlive117 发表于 2025-8-26 10:36
鲁宾都快出了,你不会刚知道吧


作者: gladiator    时间: 2025-8-26 10:38
allensakura 发表于 2025-8-26 10:38
不是
更正确的说是跟AI没关的东西砍了一些,把AI有关的东西尽量加上
从架构到指令集全面提昇

一句话概括对于打游戏的来说一点区别都没有
作者: llwin    时间: 2025-8-26 10:42
blackwell的int单元应该是翻倍了啊
作者: panzerlied    时间: 2025-8-26 10:47
你们先聊着。不是大佬,我今天很忙先出门了。
作者: panzerlied    时间: 2025-8-26 10:47
感谢真大佬借我的5060Ti 8G。
作者: 皇冠3.0L    时间: 2025-8-26 10:50
panzerlied 发表于 2025-8-26 10:47
感谢真大佬借我的5060Ti 8G。

GPU-Z少一个PhysX没打勾✔,看着真难受
作者: LambdaDelta    时间: 2025-8-26 11:40
GB对于游戏玩家来说,最大的改进是为NTC准备的双倍点过滤模式下的纹理吞吐率。
等使用NTC的游戏出来了,大概就能看到一个比较大的性能差距了。
作者: LambdaDelta    时间: 2025-8-26 11:41
llwin 发表于 2025-8-26 10:42
blackwell的int单元应该是翻倍了啊

翻倍但原有格式指令不支持,支持新格式的编译器又没有准备好。
作者: atiufo    时间: 2025-8-26 11:42
LambdaDelta 发表于 2025-8-26 11:40
GB对于游戏玩家来说,最大的改进是为NTC准备的双倍点过滤模式下的纹理吞吐率。
等使用NTC的游戏出来了,大 ...

是那个什么神经渲染吗?
作者: 欧买尬oh    时间: 2025-8-26 11:43
买GPU看TDP就行了,有多少功耗出多少性能
作者: zuochen    时间: 2025-8-26 12:03
chm128256 发表于 2025-8-26 10:29
大佬的意思是不是40系到50系的构架没啥大改进,基本上就是挤牙膏?

就是提频加点ai算力,挤牙膏也是挤的ai
作者: panzerlied    时间: 2025-8-26 12:14
欧买尬oh 发表于 2025-8-26 11:43
买GPU看TDP就行了,有多少功耗出多少性能

这两个卡都是180W
作者: LambdaDelta    时间: 2025-8-26 13:36
atiufo 发表于 2025-8-26 11:42
是那个什么神经渲染吗?

神经纹理压缩
作者: 涵涵爸爸    时间: 2025-8-26 15:46
明年年底估计60游戏卡就要公布了   50这代就这样吧
作者: 秦南瓜    时间: 2025-8-26 15:51
想到了kepler
作者: tim6252    时间: 2025-8-26 15:52
其实30 40 50本质就是一个架构,30-40提升大主要是靠从三星工艺换台积电…… 40-50制程没有提升了靠堆规模拉功耗提升也很有效了
作者: LisaSu    时间: 2025-8-26 15:59
皇冠3.0L 发表于 2025-8-26 10:50
GPU-Z少一个PhysX没打勾✔,看着真难受

舒服了 ?


作者: aibo    时间: 2025-8-26 16:12
所以新架构“同频”,光追下降的最多
作者: 秦南瓜    时间: 2025-8-26 16:14
tim6252 发表于 2025-8-26 15:52
其实30 40 50本质就是一个架构,30-40提升大主要是靠从三星工艺换台积电…… 40-50制程没有提升了靠堆规模 ...


认同,同规模同频差异太小了。所以30系现在3080白菜价仍然挺香的
作者: kzfile    时间: 2025-8-26 16:15
我拿来做并行计算,不搞ai和游戏,是不是没啥差距
作者: xy.    时间: 2025-8-26 16:15
aibo 发表于 2025-8-26 16:12
所以新架构“同频”,光追下降的最多

这里应该是显存带宽瓶颈.
作者: tonimao    时间: 2025-8-26 16:28
有一个点不能忽略,50系视频编解码器是近几代提升最大的,同时给的数量也多
作者: aibo    时间: 2025-8-26 16:31
xy. 发表于 2025-8-26 16:15
这里应该是显存带宽瓶颈.

我的刻板影响
3大妈对带宽要求一直不高,以纯算力为主的
作者: nnjohnnie    时间: 2025-8-26 16:39
涵涵爸爸 发表于 2025-8-26 15:46
明年年底估计60游戏卡就要公布了   50这代就这样吧

一代显卡本来也就两年,你这等等了一年半去了
作者: nepdaisuki    时间: 2025-8-26 16:49
chm128256 发表于 2025-8-26 10:29
大佬的意思是不是40系到50系的构架没啥大改进,基本上就是挤牙膏?

你好,是的,大的提升基本靠dlss4
作者: 醉剑渡凡尘    时间: 2025-8-26 18:01
LambdaDelta 发表于 2025-8-26 11:40
GB对于游戏玩家来说,最大的改进是为NTC准备的双倍点过滤模式下的纹理吞吐率。
等使用NTC的游戏出来了,大 ...

问题是新特性得什么时候才有大量游戏支持啊
作者: kilbadou    时间: 2025-8-26 18:50
醉剑渡凡尘 发表于 2025-8-26 18:01
问题是新特性得什么时候才有大量游戏支持啊

等多游戏支持,那60都要出来咯
作者: LambdaDelta    时间: 2025-8-26 19:59
醉剑渡凡尘 发表于 2025-8-26 18:01
问题是新特性得什么时候才有大量游戏支持啊

可以战未来就行了嘛,类似20系的光追
作者: PolyMorph    时间: 2025-8-26 20:06
gladiator 发表于 2025-8-26 10:38
一句话概括对于打游戏的来说一点区别都没有

50系对神经渲染支持度更好
https://developer.nvidia.com/blo ... ing-nvidia-rtx-kit/
作者: 醉剑渡凡尘    时间: 2025-8-26 20:29
LambdaDelta 发表于 2025-8-26 19:59
可以战未来就行了嘛,类似20系的光追

我嘞个战未来,20系光追真的敢开么
作者: PPXG    时间: 2025-8-26 21:43
aibo 发表于 2025-8-26 16:12
所以新架构“同频”,光追下降的最多

speedway疑似对显存带宽非常敏感,这是我拿5090测的显存默认28Gbps对比显存锁速率到14Gbps的结果(已经手动拉回去crossbar频率避免L2缓存性能影响),speedway性能倒退是非常高的。另外我拿2077简单试了试2160P下的光线追踪变态和路径追踪,显存速率对实际游戏帧数的影响也非常小,明显和speedway不符

(, 下载次数: 0)
(, 下载次数: 0)
(, 下载次数: 0)
(, 下载次数: 0)

作者: aibo    时间: 2025-8-26 22:00
PPXG 发表于 2025-8-26 21:43
speedway疑似对显存带宽非常敏感,这是我拿5090测的显存默认28Gbps对比显存锁速率到14Gbps的结果(已经手 ...

你这个减半也太极端了

安装lz的对比比例,你应该从28降到24.5,看有没有6%~7%的降幅
作者: tonyc    时间: 2025-8-26 23:38
你的4060Ti,怎么是满血的
1、核心规格是一样的。


Die大小差不多, 5060Ti发热密度稍高一丢丢, 所以看来5060Ti可以开放热点温度嘛~
作者: 秦南瓜    时间: 2025-8-26 23:43
PPXG 发表于 2025-8-26 21:43
speedway疑似对显存带宽非常敏感,这是我拿5090测的显存默认28Gbps对比显存锁速率到14Gbps的结果(已经手 ...

求问,crossbar频率怎么设置?
作者: zexis744    时间: 2025-8-27 00:15
这几年提升全靠TSMC, 自己负责的架构层面基本摆了


作者: ghgfhghj    时间: 2025-8-27 00:21
aibo 发表于 2025-8-26 16:31
我的刻板影响
3大妈对带宽要求一直不高,以纯算力为主的

sw刚好就是对带宽要求很高的
作者: chungexcy    时间: 2025-8-27 00:39
LambdaDelta 发表于 2025-8-26 13:36
神经纹理压缩

你说的这个是空中楼阁,现在有游戏引擎支持神经纹理压缩么,引擎都不支持,那游戏就更别提了
作者: chungexcy    时间: 2025-8-27 00:42
本帖最后由 chungexcy 于 2025-8-27 00:47 编辑
PPXG 发表于 2025-8-26 21:43
speedway疑似对显存带宽非常敏感,这是我拿5090测的显存默认28Gbps对比显存锁速率到14Gbps的结果(已经手 ...


gpu-z 里面的 memory controller load 分别是多少?sn和sw分别在不同显存速率下的占比?这个是显存带宽使用率(显存读写时间占比,剩下百分比才留给核心计算),直接影响性能
作者: PolyMorph    时间: 2025-8-27 07:20
本帖最后由 PolyMorph 于 2025-8-27 07:21 编辑
chungexcy 发表于 2025-8-27 00:39
你说的这个是空中楼阁,现在有游戏引擎支持神经纹理压缩么,引擎都不支持,那游戏就更别提了 ...


DirectX 12 Agility SDK 预览版已经能调用Tensor单元进行推理,支持20系以上GPU
https://developer.nvidia.com/blo ... -engine-developers/
作者: arbicool    时间: 2025-8-27 07:38
GB203(5080)對AD103(4080S)應該會比較直觀一點
作者: PPXG    时间: 2025-8-27 08:41
秦南瓜 发表于 2025-8-26 23:43
求问,crossbar频率怎么设置?

控制不了,我是强行锁定核心跑最高频率变相把crossbar拉回去的,只降频显存不动核心会导致crossbar掉到1.4G性能大跌
作者: 秦南瓜    时间: 2025-8-27 09:22
PPXG 发表于 2025-8-27 08:41
控制不了,我是强行锁定核心跑最高频率变相把crossbar拉回去的,只降频显存不动核心会导致crossbar掉到1. ...

OK,感谢
作者: LOLI反应堆    时间: 2025-8-27 10:13

作者: Neo_Granzon    时间: 2025-8-27 10:39
秦南瓜 发表于 2025-8-26 16:14
认同,同规模同频差异太小了。所以30系现在3080白菜价仍然挺香的

不支持DLSS3/4的FG太伤了
作者: panzerlied    时间: 2025-8-27 10:40
chm128256 发表于 2025-8-26 10:29
大佬的意思是不是40系到50系的构架没啥大改进,基本上就是挤牙膏?


可以这么说,但是测试结果并不是一边倒。所以高情商说法就是战未来。
作者: MDC    时间: 2025-8-27 10:45
tonimao 发表于 2025-8-26 16:28
有一个点不能忽略,50系视频编解码器是近几代提升最大的,同时给的数量也多 ...

视频解码器用来干啥的

作者: 秦南瓜    时间: 2025-8-27 10:47
Neo_Granzon 发表于 2025-8-27 10:39
不支持DLSS3/4的FG太伤了

这个确实。。。所以我现在在拿3090玩双卡插帧。。也算给它外挂个插帧器
作者: PolyMorph    时间: 2025-8-27 11:20
chm128256 发表于 2025-8-26 10:29
大佬的意思是不是40系到50系的构架没啥大改进,基本上就是挤牙膏?

60 70系也是走神经渲染赛道,要你这么说更加没活了

作者: panzerlied    时间: 2025-8-27 11:24
如果测试结果一边倒向AD106,那么因为AD106有带宽优势,你可以说老黄挤牙膏。

如果测试结果一边倒向GB206,GB206在带宽劣势的情况下还能反杀,老黄没有挤牙膏只是提升不算大。

目前是介于两者之间的。
作者: xeon13    时间: 2025-8-28 13:13
这些测试里边neural Shader都没用上吧

作者: Neo_Granzon    时间: 2025-8-30 07:14
panzerlied 发表于 2025-8-27 11:24
如果测试结果一边倒向AD106,那么因为AD106有带宽优势,你可以说老黄挤牙膏。

如果测试结果一边倒向GB206 ...

GB206加了那么多AI方面的功能,强化了DLSS硬件支持,芯片面积减小晶体管数量降低。

就这样,纯光栅性能完全没掉,这已经说明进步了。




欢迎光临 Chiphell - 分享与交流用户体验 (https://www.chiphell.com/) Powered by Discuz! X3.5