找回密码
 加入我们
搜索
      
查看: 8903|回复: 73

[显卡] 弄弄……

[复制链接]
发表于 2025-3-4 14:28 | 显示全部楼层
路西法大大 发表于 2025-3-4 08:42
这次的9070系列也采用了类似于30系的双倍浮点单元其中一个能兼容进行整数计算的设计,在高特效/着色压力 ...

7000系A卡已经实现浮点双泵了
发表于 2025-3-4 17:55 | 显示全部楼层
路西法大大 发表于 2025-3-4 14:52
7000系相当于超线程,9000系是硬件上就布置了双份的浮点单元能直接让IPC+30%那种。所以你能看见标称4096 ...

你还是搞混了光栅性能和浮点性能,RDNA4对于3的改进,并不在于浮点双泵,我丢给你两张参数表,你对比一下就明白了。
https://www.techpowerup.com/gpu-specs/radeon-rx-7900-gre.c4166
https://www.techpowerup.com/gpu- ... tx-4080-super.c4182

RX7900GRE VS RTX4080Super

前者5120 shaders,后者10240个cuda单元
Boost clock 前者 2.245G,后者2.55G
单精度浮点性能:前者2.245*(5120*2)*2=45.978Tflops,后者2.55*10240*2=52.224Tflops
是不是7900GRE的5120可以算两倍?不信可以让有RX7000显卡的坛友跑一下AIDA64的GPGPU的显卡单精度浮点性能。

至于9070XT的单精度浮点性能,按现在boost 频率3.05G,4096个shader来算,应该是3.05*(4096*2)*2=49.97Tflops,比7900GRE也就高了8.7%,但性能那是强了远远不止20%,可是这就和光栅性能,缓存优化,显存压缩等有关,整个架构都大幅度改进了,而不仅仅是单精度浮点的小幅度提升。
而且RDNA4也加入了对int4/int8/fp8/bf16/fp16等的支持,这个对低精度的AI来 说是巨大的收益,根本不是在单精度浮点的提升上能看出来的。
发表于 2025-3-4 18:37 | 显示全部楼层
LOLI反应堆 发表于 2025-3-4 18:24
他的意思是7000系虽然有双份的FP32理论值,但实际效率不高。在结果里就像超线程和物理核心之间的差距。 ...

我理解你说的效率不高,是指rdna3的理论浮点性能没能体现到显卡的光栅性能上。或者说实际光栅性能被其他架构浮点性能相近的gpu吊打,但这和浮点性能无关啊。
能最简单测试gpu/cpu单双精度浮点能力的就是aida64的gpgpu了,测一下就知道了。
举另外一个不太恰当的例子,zen5的单双精度浮点,用gpgpu测试,8核的9700x和24核的14900k旗鼓相当,也不比285K差太多。但大多数依赖浮点运算渲染测试,9700x根本无法跟两款牙膏旗舰对比,其实也是类似的道理。
发表于 2025-3-4 19:33 | 显示全部楼层
路西法大大 发表于 2025-3-4 19:17
7000系列那浮点理论值是虚的,实际作用很小。一般HT的效率大约能增加30%不到的算力而30%浮点算力的增加大 ...

理论值虚不虚,跑一下测试就知道了
发表于 2025-3-4 20:12 | 显示全部楼层
路西法大大 发表于 2025-3-4 19:48
测出来的理论浮点也许会高一些但是游戏基本调用不到发挥不出来又有啥用呢?这次9000系列的IPC就是比7000 ...

是啊,但这和你说的到了RDNA4才支持浮点双泵是两回事啊,人家RX7000只是优化不好,不等于不支持啊。
发表于 2025-3-4 21:53 | 显示全部楼层
路西法大大 发表于 2025-3-4 21:10
但我一开始说的就是双倍的浮点计算单元啊,上一代是硬件上只有一个浮点计算单元但是设计上能同时运作两条 ...

你可能对超线程有什么误解,超线程可不能让浮点性能翻倍,只能让一些无法充分利用计算资源的应用多线程运算时减少处理器的等待时间。
RDNA3已经可以让整数计算单元同时兼做浮点计算,这点RDNA4并没有不同。只是AMD在计算shader的时候,只算浮点单元,而Nvidia是两种单元都算。所以会出现类似规格的显卡,N的cuda核心是A的stream processors的两倍。
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-5-5 14:56 , Processed in 0.009813 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表