Chiphell - 分享与交流用户体验

标题: Ada Lovelace vs Blackwell，略显诡异的测试结果。 [打印本页]

作者: panzerlied 时间: 2025-8-26 10:26
提示: 作者被禁止或删除内容自动屏蔽

作者: chm128256 时间: 2025-8-26 10:29
大佬的意思是不是40系到50系的构架没啥大改进，基本上就是挤牙膏？

作者: gladiator 时间: 2025-8-26 10:32
Blackwell 2.0不是本质就是 Ada Lovelace 2.0或者说refresh么提升主要是规模调整和G7显存带宽的加持

作者: foxlive117 时间: 2025-8-26 10:36

chm128256 发表于 2025-8-26 10:29
大佬的意思是不是40系到50系的构架没啥大改进，基本上就是挤牙膏？

鲁宾都快出了，你不会刚知道吧

作者: allensakura 时间: 2025-8-26 10:38

gladiator 发表于 2025-8-26 10:32
Blackwell 2.0不是本质就是 Ada Lovelace 2.0或者说refresh么提升主要是规模调整和G7显存带宽的加持 ...

不是
更正确的说是跟AI没关的东西砍了一些，把AI有关的东西尽量加上
从架构到指令集全面提昇

但是新的格式.新的指令集.新的优化方式都不用上的话只能说一点提昇都没有

作者: chm128256 时间: 2025-8-26 10:38

foxlive117 发表于 2025-8-26 10:36
鲁宾都快出了，你不会刚知道吧

作者: gladiator 时间: 2025-8-26 10:38

allensakura 发表于 2025-8-26 10:38
不是
更正确的说是跟AI没关的东西砍了一些，把AI有关的东西尽量加上
从架构到指令集全面提昇

一句话概括对于打游戏的来说一点区别都没有

作者: llwin 时间: 2025-8-26 10:42
blackwell的int单元应该是翻倍了啊

作者: panzerlied 时间: 2025-8-26 10:47
提示: 作者被禁止或删除内容自动屏蔽

作者: 皇冠3.0L 时间: 2025-8-26 10:50

panzerlied 发表于 2025-8-26 10:47
感谢真大佬借我的5060Ti 8G。

GPU-Z少一个PhysX没打勾✔，看着真难受

作者: LambdaDelta 时间: 2025-8-26 11:40
GB对于游戏玩家来说，最大的改进是为NTC准备的双倍点过滤模式下的纹理吞吐率。
等使用NTC的游戏出来了，大概就能看到一个比较大的性能差距了。

作者: LambdaDelta 时间: 2025-8-26 11:41

llwin 发表于 2025-8-26 10:42
blackwell的int单元应该是翻倍了啊

翻倍但原有格式指令不支持，支持新格式的编译器又没有准备好。

作者: atiufo 时间: 2025-8-26 11:42

LambdaDelta 发表于 2025-8-26 11:40
GB对于游戏玩家来说，最大的改进是为NTC准备的双倍点过滤模式下的纹理吞吐率。
等使用NTC的游戏出来了，大 ...

是那个什么神经渲染吗？

作者: 欧买尬oh 时间: 2025-8-26 11:43
买GPU看TDP就行了，有多少功耗出多少性能

作者: zuochen 时间: 2025-8-26 12:03

chm128256 发表于 2025-8-26 10:29
大佬的意思是不是40系到50系的构架没啥大改进，基本上就是挤牙膏？

就是提频加点ai算力，挤牙膏也是挤的ai

作者: panzerlied 时间: 2025-8-26 12:14
提示: 作者被禁止或删除内容自动屏蔽

作者: LambdaDelta 时间: 2025-8-26 13:36

atiufo 发表于 2025-8-26 11:42
是那个什么神经渲染吗？

神经纹理压缩

作者: 涵涵爸爸 时间: 2025-8-26 15:46
明年年底估计60游戏卡就要公布了 50这代就这样吧

作者: 秦南瓜 时间: 2025-8-26 15:51
想到了kepler

作者: tim6252 时间: 2025-8-26 15:52
其实30 40 50本质就是一个架构，30-40提升大主要是靠从三星工艺换台积电…… 40-50制程没有提升了靠堆规模拉功耗提升也很有效了

作者: LisaSu 时间: 2025-8-26 15:59

皇冠3.0L 发表于 2025-8-26 10:50
GPU-Z少一个PhysX没打勾✔，看着真难受

舒服了？

作者: aibo 时间: 2025-8-26 16:12
所以新架构“同频”，光追下降的最多

作者: 秦南瓜 时间: 2025-8-26 16:14

tim6252 发表于 2025-8-26 15:52
其实30 40 50本质就是一个架构，30-40提升大主要是靠从三星工艺换台积电…… 40-50制程没有提升了靠堆规模 ...

认同，同规模同频差异太小了。所以30系现在3080白菜价仍然挺香的

作者: kzfile 时间: 2025-8-26 16:15
我拿来做并行计算，不搞ai和游戏，是不是没啥差距

作者: xy. 时间: 2025-8-26 16:15

aibo 发表于 2025-8-26 16:12
所以新架构“同频”，光追下降的最多

这里应该是显存带宽瓶颈.

作者: tonimao 时间: 2025-8-26 16:28
有一个点不能忽略，50系视频编解码器是近几代提升最大的，同时给的数量也多

作者: aibo 时间: 2025-8-26 16:31

xy. 发表于 2025-8-26 16:15
这里应该是显存带宽瓶颈.

我的刻板影响
3大妈对带宽要求一直不高，以纯算力为主的

作者: nnjohnnie 时间: 2025-8-26 16:39

涵涵爸爸发表于 2025-8-26 15:46
明年年底估计60游戏卡就要公布了 50这代就这样吧

一代显卡本来也就两年，你这等等了一年半去了

作者: nepdaisuki 时间: 2025-8-26 16:49

chm128256 发表于 2025-8-26 10:29
大佬的意思是不是40系到50系的构架没啥大改进，基本上就是挤牙膏？

你好，是的，大的提升基本靠dlss4

作者: 醉剑渡凡尘 时间: 2025-8-26 18:01

LambdaDelta 发表于 2025-8-26 11:40
GB对于游戏玩家来说，最大的改进是为NTC准备的双倍点过滤模式下的纹理吞吐率。
等使用NTC的游戏出来了，大 ...

问题是新特性得什么时候才有大量游戏支持啊

作者: kilbadou 时间: 2025-8-26 18:50

醉剑渡凡尘发表于 2025-8-26 18:01
问题是新特性得什么时候才有大量游戏支持啊

等多游戏支持，那60都要出来咯

作者: LambdaDelta 时间: 2025-8-26 19:59

醉剑渡凡尘发表于 2025-8-26 18:01
问题是新特性得什么时候才有大量游戏支持啊

可以战未来就行了嘛，类似20系的光追

作者: PolyMorph 时间: 2025-8-26 20:06

gladiator 发表于 2025-8-26 10:38
一句话概括对于打游戏的来说一点区别都没有

50系对神经渲染支持度更好
https://developer.nvidia.com/blo ... ing-nvidia-rtx-kit/

作者: 醉剑渡凡尘 时间: 2025-8-26 20:29

LambdaDelta 发表于 2025-8-26 19:59
可以战未来就行了嘛，类似20系的光追

我嘞个战未来，20系光追真的敢开么

作者: PPXG 时间: 2025-8-26 21:43

aibo 发表于 2025-8-26 16:12
所以新架构“同频”，光追下降的最多

speedway疑似对显存带宽非常敏感，这是我拿5090测的显存默认28Gbps对比显存锁速率到14Gbps的结果（已经手动拉回去crossbar频率避免L2缓存性能影响），speedway性能倒退是非常高的。另外我拿2077简单试了试2160P下的光线追踪变态和路径追踪，显存速率对实际游戏帧数的影响也非常小，明显和speedway不符

(, 下载次数: 22)
(, 下载次数: 19)
(, 下载次数: 18)
(, 下载次数: 21)

作者: aibo 时间: 2025-8-26 22:00

PPXG 发表于 2025-8-26 21:43
speedway疑似对显存带宽非常敏感，这是我拿5090测的显存默认28Gbps对比显存锁速率到14Gbps的结果（已经手 ...

你这个减半也太极端了

安装lz的对比比例，你应该从28降到24.5，看有没有6%~7%的降幅

作者: tonyc 时间: 2025-8-26 23:38
你的4060Ti，怎么是满血的

1、核心规格是一样的。

Die大小差不多, 5060Ti发热密度稍高一丢丢, 所以看来5060Ti可以开放热点温度嘛~

作者: 秦南瓜 时间: 2025-8-26 23:43

PPXG 发表于 2025-8-26 21:43
speedway疑似对显存带宽非常敏感，这是我拿5090测的显存默认28Gbps对比显存锁速率到14Gbps的结果（已经手 ...

求问，crossbar频率怎么设置？

作者: zexis744 时间: 2025-8-27 00:15
这几年提升全靠TSMC，自己负责的架构层面基本摆了

作者: ghgfhghj 时间: 2025-8-27 00:21

aibo 发表于 2025-8-26 16:31
我的刻板影响
3大妈对带宽要求一直不高，以纯算力为主的

sw刚好就是对带宽要求很高的

作者: chungexcy 时间: 2025-8-27 00:39

LambdaDelta 发表于 2025-8-26 13:36
神经纹理压缩

你说的这个是空中楼阁，现在有游戏引擎支持神经纹理压缩么，引擎都不支持，那游戏就更别提了

作者: chungexcy 时间: 2025-8-27 00:42
本帖最后由 chungexcy 于 2025-8-27 00:47 编辑

PPXG 发表于 2025-8-26 21:43
speedway疑似对显存带宽非常敏感，这是我拿5090测的显存默认28Gbps对比显存锁速率到14Gbps的结果（已经手 ...

gpu-z 里面的 memory controller load 分别是多少？sn和sw分别在不同显存速率下的占比？这个是显存带宽使用率（显存读写时间占比，剩下百分比才留给核心计算），直接影响性能

作者: PolyMorph 时间: 2025-8-27 07:20
本帖最后由 PolyMorph 于 2025-8-27 07:21 编辑

chungexcy 发表于 2025-8-27 00:39
你说的这个是空中楼阁，现在有游戏引擎支持神经纹理压缩么，引擎都不支持，那游戏就更别提了 ...

DirectX 12 Agility SDK 预览版已经能调用Tensor单元进行推理，支持20系以上GPU
https://developer.nvidia.com/blo ... -engine-developers/

作者: arbicool 时间: 2025-8-27 07:38
GB203(5080)對AD103(4080S)應該會比較直觀一點

作者: PPXG 时间: 2025-8-27 08:41

秦南瓜发表于 2025-8-26 23:43
求问，crossbar频率怎么设置？

控制不了，我是强行锁定核心跑最高频率变相把crossbar拉回去的，只降频显存不动核心会导致crossbar掉到1.4G性能大跌

作者: 秦南瓜 时间: 2025-8-27 09:22

PPXG 发表于 2025-8-27 08:41
控制不了，我是强行锁定核心跑最高频率变相把crossbar拉回去的，只降频显存不动核心会导致crossbar掉到1. ...

OK，感谢

作者: LOLI反应堆 时间: 2025-8-27 10:13

作者: Neo_Granzon 时间: 2025-8-27 10:39

秦南瓜发表于 2025-8-26 16:14
认同，同规模同频差异太小了。所以30系现在3080白菜价仍然挺香的

不支持DLSS3/4的FG太伤了

作者: panzerlied 时间: 2025-8-27 10:40
提示: 作者被禁止或删除内容自动屏蔽

作者: MDC 时间: 2025-8-27 10:45

tonimao 发表于 2025-8-26 16:28
有一个点不能忽略，50系视频编解码器是近几代提升最大的，同时给的数量也多 ...

视频解码器用来干啥的

作者: 秦南瓜 时间: 2025-8-27 10:47

Neo_Granzon 发表于 2025-8-27 10:39
不支持DLSS3/4的FG太伤了

这个确实。。。所以我现在在拿3090玩双卡插帧。。也算给它外挂个插帧器

作者: PolyMorph 时间: 2025-8-27 11:20

chm128256 发表于 2025-8-26 10:29
大佬的意思是不是40系到50系的构架没啥大改进，基本上就是挤牙膏？

60 70系也是走神经渲染赛道，要你这么说更加没活了

作者: panzerlied 时间: 2025-8-27 11:24
提示: 作者被禁止或删除内容自动屏蔽

作者: xeon13 时间: 2025-8-28 13:13
这些测试里边neural Shader都没用上吧

作者: Neo_Granzon 时间: 2025-8-30 07:14

panzerlied 发表于 2025-8-27 11:24
如果测试结果一边倒向AD106，那么因为AD106有带宽优势，你可以说老黄挤牙膏。

如果测试结果一边倒向GB206 ...

GB206加了那么多AI方面的功能，强化了DLSS硬件支持，芯片面积减小晶体管数量降低。

就这样，纯光栅性能完全没掉，这已经说明进步了。

作者: areter 时间: 2025-9-1 04:51
其实这几代的光栅IPC提升很小，基本上就是堆核心+功耗换来的。看看60系架构和台积电n3p工艺能给多少惊喜了。

欢迎光临 Chiphell - 分享与交流用户体验 (https://www.chiphell.com/)