sinopart 发表于 2025-1-29 15:48

连续三代NV家的显卡ALU效率都是完全一致了吧?

从30系到现在,似乎就没有效率上的改进,导致基本上看CUDA数量就能分析单精度浮点游戏性能。下一代6090在改制程的同时能像CPU那样改进一下ALU单元的效率吗?

gartour 发表于 2025-1-29 16:23

如果不是硬件研究方向,单从用户角度,没必要关心这个。只需要关心实际性能,价格,功耗。

只要6090能做到性能翻倍,价格5000,功耗200w,那就是nb。至于用了多少个cuda,对我有什么影响?用1亿个也没关系的。

aasa0001 发表于 2025-1-29 23:36

提升"ALU效率"根本就影响不到游戏性能。
如果你以为游戏性能是受单精度浮点瓶颈,那4k性能就是1080p的1/4[再见]

我輩樹である 发表于 2025-1-29 23:58

50补全了int32单元,也算是有点改进了。40只有1/2。

要怎么提升单精度浮点呢,因为放再多的流处理器会影响到放tensor core,现在到底哪一边才是黄的心头肉,不言而喻了。

只能寄望有一天这种割裂的状态消失,比如老黄挖到黑科技,tensor core可以算渲染管线的任务了。

zexis744 发表于 2025-1-30 00:35

貌似还开倒车改回pascal那种int32/fp32兼顾的设计了

从turing分离int32和fp32,到ampere/ada改回一半,到现在完全改回,兜兜转转变种挤牙膏[偷笑]

kingofgu 发表于 2025-1-30 09:19

我輩樹である 发表于 2025-1-29 23:58
50补全了int32单元,也算是有点改进了。40只有1/2。

要怎么提升单精度浮点呢,因为放再多的流处理器会影响 ...

AMD把RDNA和CDNA分开也没用啊

世界交通员 发表于 2025-1-30 11:44

gartour 发表于 2025-1-29 16:23
如果不是硬件研究方向,单从用户角度,没必要关心这个。只需要关心实际性能,价格,功耗。

只要6090能做到 ...

因为这种架构改进,才能在每晶体管价格不明显降低的现在,实现每元性能的有效提升。

atiufo 发表于 2025-1-30 11:49

zexis744 发表于 2025-1-30 00:35
貌似还开倒车改回pascal那种int32/fp32兼顾的设计了

从turing分离int32和fp32,到ampere/ada改回一半,到 ...

你就说架构改没改吧,我们已经很努力了,哈哈哈

tengyun 发表于 2025-1-30 13:01

zexis744 发表于 2025-1-30 00:35
貌似还开倒车改回pascal那种int32/fp32兼顾的设计了

从turing分离int32和fp32,到ampere/ada改回一半,到 ...

[偷笑]
1080TI 坏了,我活成版本真神

Flanker 发表于 2025-1-30 15:13

zexis744 发表于 2025-1-30 00:35
貌似还开倒车改回pascal那种int32/fp32兼顾的设计了

从turing分离int32和fp32,到ampere/ada改回一半,到 ...

turing之前压根不开放int32性能

PolyMorph 发表于 2025-1-30 15:18

稍微懂一点的都能算出50系有提升
页: [1]
查看完整版本: 连续三代NV家的显卡ALU效率都是完全一致了吧?