连续三代NV家的显卡ALU效率都是完全一致了吧？

sinopart 发表于 2025-1-29 15:48

从30系到现在，似乎就没有效率上的改进，导致基本上看CUDA数量就能分析单精度浮点游戏性能。下一代6090在改制程的同时能像CPU那样改进一下ALU单元的效率吗？

gartour 发表于 2025-1-29 16:23

如果不是硬件研究方向，单从用户角度，没必要关心这个。只需要关心实际性能，价格，功耗。

只要6090能做到性能翻倍，价格5000，功耗200w，那就是nb。至于用了多少个cuda，对我有什么影响？用1亿个也没关系的。

aasa0001 发表于 2025-1-29 23:36

提升"ALU效率"根本就影响不到游戏性能。
如果你以为游戏性能是受单精度浮点瓶颈，那4k性能就是1080p的1/4[再见]

我輩樹である 发表于 2025-1-29 23:58

50补全了int32单元，也算是有点改进了。40只有1/2。

要怎么提升单精度浮点呢，因为放再多的流处理器会影响到放tensor core，现在到底哪一边才是黄的心头肉，不言而喻了。

只能寄望有一天这种割裂的状态消失，比如老黄挖到黑科技，tensor core可以算渲染管线的任务了。

zexis744 发表于 2025-1-30 00:35

貌似还开倒车改回pascal那种int32/fp32兼顾的设计了

从turing分离int32和fp32，到ampere/ada改回一半，到现在完全改回，兜兜转转变种挤牙膏[偷笑]

kingofgu 发表于 2025-1-30 09:19

我輩樹である发表于 2025-1-29 23:58
50补全了int32单元，也算是有点改进了。40只有1/2。

要怎么提升单精度浮点呢，因为放再多的流处理器会影响 ...

AMD把RDNA和CDNA分开也没用啊

世界交通员 发表于 2025-1-30 11:44

gartour 发表于 2025-1-29 16:23
如果不是硬件研究方向，单从用户角度，没必要关心这个。只需要关心实际性能，价格，功耗。

只要6090能做到 ...

因为这种架构改进，才能在每晶体管价格不明显降低的现在，实现每元性能的有效提升。

atiufo 发表于 2025-1-30 11:49

zexis744 发表于 2025-1-30 00:35
貌似还开倒车改回pascal那种int32/fp32兼顾的设计了

从turing分离int32和fp32，到ampere/ada改回一半，到 ...

你就说架构改没改吧，我们已经很努力了，哈哈哈

tengyun 发表于 2025-1-30 13:01

zexis744 发表于 2025-1-30 00:35
貌似还开倒车改回pascal那种int32/fp32兼顾的设计了

从turing分离int32和fp32，到ampere/ada改回一半，到 ...

[偷笑]
1080TI 坏了，我活成版本真神

Flanker 发表于 2025-1-30 15:13

zexis744 发表于 2025-1-30 00:35
貌似还开倒车改回pascal那种int32/fp32兼顾的设计了

从turing分离int32和fp32，到ampere/ada改回一半，到 ...

turing之前压根不开放int32性能

PolyMorph 发表于 2025-1-30 15:18

稍微懂一点的都能算出50系有提升

页: [1]

Chiphell - 分享与交流用户体验's Archiver