连续三代NV家的显卡ALU效率都是完全一致了吧?
从30系到现在,似乎就没有效率上的改进,导致基本上看CUDA数量就能分析单精度浮点游戏性能。下一代6090在改制程的同时能像CPU那样改进一下ALU单元的效率吗? 如果不是硬件研究方向,单从用户角度,没必要关心这个。只需要关心实际性能,价格,功耗。只要6090能做到性能翻倍,价格5000,功耗200w,那就是nb。至于用了多少个cuda,对我有什么影响?用1亿个也没关系的。 提升"ALU效率"根本就影响不到游戏性能。
如果你以为游戏性能是受单精度浮点瓶颈,那4k性能就是1080p的1/4[再见] 50补全了int32单元,也算是有点改进了。40只有1/2。
要怎么提升单精度浮点呢,因为放再多的流处理器会影响到放tensor core,现在到底哪一边才是黄的心头肉,不言而喻了。
只能寄望有一天这种割裂的状态消失,比如老黄挖到黑科技,tensor core可以算渲染管线的任务了。 貌似还开倒车改回pascal那种int32/fp32兼顾的设计了
从turing分离int32和fp32,到ampere/ada改回一半,到现在完全改回,兜兜转转变种挤牙膏[偷笑] 我輩樹である 发表于 2025-1-29 23:58
50补全了int32单元,也算是有点改进了。40只有1/2。
要怎么提升单精度浮点呢,因为放再多的流处理器会影响 ...
AMD把RDNA和CDNA分开也没用啊 gartour 发表于 2025-1-29 16:23
如果不是硬件研究方向,单从用户角度,没必要关心这个。只需要关心实际性能,价格,功耗。
只要6090能做到 ...
因为这种架构改进,才能在每晶体管价格不明显降低的现在,实现每元性能的有效提升。 zexis744 发表于 2025-1-30 00:35
貌似还开倒车改回pascal那种int32/fp32兼顾的设计了
从turing分离int32和fp32,到ampere/ada改回一半,到 ...
你就说架构改没改吧,我们已经很努力了,哈哈哈 zexis744 发表于 2025-1-30 00:35
貌似还开倒车改回pascal那种int32/fp32兼顾的设计了
从turing分离int32和fp32,到ampere/ada改回一半,到 ...
[偷笑]
1080TI 坏了,我活成版本真神 zexis744 发表于 2025-1-30 00:35
貌似还开倒车改回pascal那种int32/fp32兼顾的设计了
从turing分离int32和fp32,到ampere/ada改回一半,到 ...
turing之前压根不开放int32性能
稍微懂一点的都能算出50系有提升
页:
[1]