找回密码
 加入我们
搜索
      
查看: 10441|回复: 73

[显卡] 弄弄……

[复制链接]
发表于 2025-3-3 22:08 | 显示全部楼层 |阅读模式
53开
33开
18开
27开
12开
发表于 2025-3-4 22:34 | 显示全部楼层
哟, 冷水鱼你这厮还活着啊,从小蔡接手雄狮国际店就没见过你了
发表于 2025-3-4 22:16 | 显示全部楼层
gihu 发表于 2025-3-4 21:53
你可能对超线程有什么误解,超线程可不能让浮点性能翻倍,只能让一些无法充分利用计算资源的应用多线程运 ...

RDNA3的架构图用的是dual issue simd units,也就是双发射simd单元
01.png
RDNA4的架构图用的是dueal simd vector units,也就是双simd计算单元
02.png
具体的细节差别你细品。
发表于 2025-3-4 21:53 | 显示全部楼层
路西法大大 发表于 2025-3-4 21:10
但我一开始说的就是双倍的浮点计算单元啊,上一代是硬件上只有一个浮点计算单元但是设计上能同时运作两条 ...

你可能对超线程有什么误解,超线程可不能让浮点性能翻倍,只能让一些无法充分利用计算资源的应用多线程运算时减少处理器的等待时间。
RDNA3已经可以让整数计算单元同时兼做浮点计算,这点RDNA4并没有不同。只是AMD在计算shader的时候,只算浮点单元,而Nvidia是两种单元都算。所以会出现类似规格的显卡,N的cuda核心是A的stream processors的两倍。
 楼主| 发表于 2025-3-4 21:49 | 显示全部楼层
◥█◣神◢█◤ 发表于 2025-3-4 21:44
您感觉比6900XT强多少?我是3440*14402。5K

我没6900xt啊。。所以不晓得哦
发表于 2025-3-4 21:44 来自手机 | 显示全部楼层
冷水鱼 发表于 2025-3-4 21:01
2077特效全开,4k分辨率大概3,40帧吧。。

您感觉比6900XT强多少?我是3440*14402。5K
发表于 2025-3-4 21:14 | 显示全部楼层
弄出来了吗多吗
发表于 2025-3-4 21:10 | 显示全部楼层
gihu 发表于 2025-3-4 20:12
是啊,但这和你说的到了RDNA4才支持浮点双泵是两回事啊,人家RX7000只是优化不好,不等于不支持啊。 ...

但我一开始说的就是双倍的浮点计算单元啊,上一代是硬件上只有一个浮点计算单元但是设计上能同时运作两条运算指令也就是类似于CPU上超线程的方式结果不出意外的失败了。也就是说AMD一开始是想用超线程的方式来取巧达到既省晶体管又产生较高效能但是最终证明行不通,最终还是只能走回去30系的路子多花了不少的晶体管来容纳额外的一个浮点计算单元导致核心在看似规格不高的情况下最终的核心面积晶体管等仍然是比较庞大的。
 楼主| 发表于 2025-3-4 21:01 | 显示全部楼层
◥█◣神◢█◤ 发表于 2025-3-4 17:58
2077
天国拯救者2
有试过吗?~~

2077特效全开,4k分辨率大概3,40帧吧。。
 楼主| 发表于 2025-3-4 21:00 | 显示全部楼层

对了三个,错了两个
发表于 2025-3-4 20:12 | 显示全部楼层
路西法大大 发表于 2025-3-4 19:48
测出来的理论浮点也许会高一些但是游戏基本调用不到发挥不出来又有啥用呢?这次9000系列的IPC就是比7000 ...

是啊,但这和你说的到了RDNA4才支持浮点双泵是两回事啊,人家RX7000只是优化不好,不等于不支持啊。
发表于 2025-3-4 19:48 | 显示全部楼层
gihu 发表于 2025-3-4 19:33
理论值虚不虚,跑一下测试就知道了

测出来的理论浮点也许会高一些但是游戏基本调用不到发挥不出来又有啥用呢?这次9000系列的IPC就是比7000系列高了40%,这里面除了更高的主频外剩下就是这个类似于30系的设计起的作用。
发表于 2025-3-4 19:33 | 显示全部楼层
路西法大大 发表于 2025-3-4 19:17
7000系列那浮点理论值是虚的,实际作用很小。一般HT的效率大约能增加30%不到的算力而30%浮点算力的增加大 ...

理论值虚不虚,跑一下测试就知道了
发表于 2025-3-4 19:17 | 显示全部楼层
本帖最后由 路西法大大 于 2025-3-4 19:23 编辑
gihu 发表于 2025-3-4 17:55
你还是搞混了光栅性能和浮点性能,RDNA4对于3的改进,并不在于浮点双泵,我丢给你两张参数表,你对比一下 ...


7000系列那浮点理论值是虚的,实际作用很小。一般HT的效率大约能增加30%不到的算力而30%浮点算力的增加大约只能提升10%左右的图形性能换算到游戏帧数更低。更何况还有很大一部分游戏就根本实现不了这个浮点超线程等于是0提升,而这次9000系的物理浮点单元X2那可就是实打实的所有游戏都能享受的到这个翻倍的浮点性能,这换算到游戏上是真的会有30%的性能增幅跟30系的情况是一样的。
发表于 2025-3-4 18:37 | 显示全部楼层
LOLI反应堆 发表于 2025-3-4 18:24
他的意思是7000系虽然有双份的FP32理论值,但实际效率不高。在结果里就像超线程和物理核心之间的差距。 ...

我理解你说的效率不高,是指rdna3的理论浮点性能没能体现到显卡的光栅性能上。或者说实际光栅性能被其他架构浮点性能相近的gpu吊打,但这和浮点性能无关啊。
能最简单测试gpu/cpu单双精度浮点能力的就是aida64的gpgpu了,测一下就知道了。
举另外一个不太恰当的例子,zen5的单双精度浮点,用gpgpu测试,8核的9700x和24核的14900k旗鼓相当,也不比285K差太多。但大多数依赖浮点运算渲染测试,9700x根本无法跟两款牙膏旗舰对比,其实也是类似的道理。
发表于 2025-3-4 18:24 | 显示全部楼层
本帖最后由 LOLI反应堆 于 2025-3-4 18:27 编辑
gihu 发表于 2025-3-4 17:55
你还是搞混了光栅性能和浮点性能,RDNA4对于3的改进,并不在于浮点双泵,我丢给你两张参数表,你对比一下 ...


他的意思是7000系虽然有双份的FP32理论值,但实际效率不高。可能因为受设计上诸多的局限性在结果里就像超线程和物理核心之间的差距。
发表于 2025-3-4 18:00 | 显示全部楼层
明天晚上就知道了,就怕废柴。。。
发表于 2025-3-4 17:58 | 显示全部楼层
2077
天国拯救者2
有试过吗?~~
发表于 2025-3-4 17:55 | 显示全部楼层
路西法大大 发表于 2025-3-4 14:52
7000系相当于超线程,9000系是硬件上就布置了双份的浮点单元能直接让IPC+30%那种。所以你能看见标称4096 ...

你还是搞混了光栅性能和浮点性能,RDNA4对于3的改进,并不在于浮点双泵,我丢给你两张参数表,你对比一下就明白了。
https://www.techpowerup.com/gpu-specs/radeon-rx-7900-gre.c4166
https://www.techpowerup.com/gpu- ... tx-4080-super.c4182

RX7900GRE VS RTX4080Super

前者5120 shaders,后者10240个cuda单元
Boost clock 前者 2.245G,后者2.55G
单精度浮点性能:前者2.245*(5120*2)*2=45.978Tflops,后者2.55*10240*2=52.224Tflops
是不是7900GRE的5120可以算两倍?不信可以让有RX7000显卡的坛友跑一下AIDA64的GPGPU的显卡单精度浮点性能。

至于9070XT的单精度浮点性能,按现在boost 频率3.05G,4096个shader来算,应该是3.05*(4096*2)*2=49.97Tflops,比7900GRE也就高了8.7%,但性能那是强了远远不止20%,可是这就和光栅性能,缓存优化,显存压缩等有关,整个架构都大幅度改进了,而不仅仅是单精度浮点的小幅度提升。
而且RDNA4也加入了对int4/int8/fp8/bf16/fp16等的支持,这个对低精度的AI来 说是巨大的收益,根本不是在单精度浮点的提升上能看出来的。
发表于 2025-3-4 14:58 | 显示全部楼层
冷水鱼 发表于 2025-3-4 14:55
也许默频高点咯。只能这种解释了。

但是并没有高多少哇
算了还是等等吧
 楼主| 发表于 2025-3-4 14:55 来自手机 | 显示全部楼层
wjm47196 发表于 2025-3-4 14:51
为什么会通通高10%啊,什么牌子的卡哦

也许默频高点咯。只能这种解释了。
发表于 2025-3-4 14:52 | 显示全部楼层
本帖最后由 路西法大大 于 2025-3-4 15:00 编辑
gihu 发表于 2025-3-4 14:28
7000系A卡已经实现浮点双泵了


7000系相当于超线程,9000系是硬件上就布置了双份的浮点单元能直接让IPC+30%那种。所以你能看见标称4096流处理器规格的9070XT已经能跟4080光栅上五五开了,因为它按照老黄的算法就是8192流加上主频的提升就是跟4080差不多的。
79BBFD1EED445258BF37A3FCB753A932.jpg
这个图上就描述的很清晰了,架构跟30系40系是大差不差的。
发表于 2025-3-4 14:51 | 显示全部楼层
冷水鱼 发表于 2025-3-4 14:39
tse两千分差距,想靠超频拉2000,有点难吧

为什么会通通高10%啊,什么牌子的卡哦
发表于 2025-3-4 14:50 | 显示全部楼层
atiufo 发表于 2025-3-4 13:55
最后12k的是什么跑分?

谜语人?我也不知道
 楼主| 发表于 2025-3-4 14:39 来自手机 | 显示全部楼层
fingtn13127 发表于 2025-3-3 23:04
TS可以上3W么?
TSE可以上1W5么?想知道
谢谢

tse两千分差距,想靠超频拉2000,有点难吧
发表于 2025-3-4 14:37 来自手机 | 显示全部楼层
鬼武人 发表于 2025-3-4 13:48
结合官宣对比79GRE,4K领先幅度大于2K来看,

TS 3W3, 持平5080

反正没有这么高,但是也不止2w7
发表于 2025-3-4 14:28 | 显示全部楼层
路西法大大 发表于 2025-3-4 08:42
这次的9070系列也采用了类似于30系的双倍浮点单元其中一个能兼容进行整数计算的设计,在高特效/着色压力 ...

7000系A卡已经实现浮点双泵了
发表于 2025-3-4 14:23 | 显示全部楼层
到处都是谜语人
发表于 2025-3-4 13:55 | 显示全部楼层

最后12k的是什么跑分?
发表于 2025-3-4 13:48 | 显示全部楼层


结合官宣对比79GRE,4K领先幅度大于2K来看,

TS 3W3, 持平5080
TSE 1W8,持平4090D
超频幅度10%

猜的
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-6-18 14:10 , Processed in 0.014471 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表