我来告诉你们为啥50系毫无提升，本质 Ada Refresh。。。

wjm47196 · 发表于 2025-2-1 13:56

赫敏发表于 2025-2-1 13:51
如果是临时拉出来凑数的游戏卡，计算卡岂不是翻车更狠？

计算卡就是堆规模，又不用考虑rops后端问题，上的还是hbm。。。
而且有点趁大家都在炼丹赶紧卖炉子，结果炉子太热了，把人都烤炸了，现在转单去b300了
真提升还得看n3 rubin

chungexcy · 发表于 2025-2-1 13:58

Epilogue 发表于 2025-2-1 13:49
5070按照老黄的ppt，提升不是和5070ti一样么，只有5080是最少的，你这数据是如何得出的? ...

你等这个月底的评测吧。老黄ppt后面更新了5070ti、5080的ppt，都给改成不到15%了。

BFG9K · 发表于 2025-2-1 14:00

chungexcy 发表于 2025-2-1 13:52
除非降价，263 mm2 卖现在这个价格意义不大

其实我比较好奇GB207是什么样子的，感觉很难在AD107的基础上提升效率了

chungexcy · 发表于 2025-2-1 14:01

allensakura 发表于 2025-2-1 13:44
大概率是小幅改进，着重改进内部设计以提升频率
结果最后跟RDNA3一样在3G翻车了
5080要是同功耗下能跑3.5G ...

你这一说我才想起，之前20%的频率提升谣言也没了，更像之前的版本被毙掉了

xjr12000 · 发表于 2025-2-1 14:01

其实不难明白，老黄毕竟要考虑长久，要支撑一个几万亿美元市值的公司，必须要有可持续性
可持续性从哪来？
简单啊，明明可以一步走到的事，我给他换成三步走，这样每一步都能赚一次钱
这持续性不就出来了

chungexcy · 发表于 2025-2-1 14:03

BFG9K 发表于 2025-2-1 14:00
其实我比较好奇GB207是什么样子的，感觉很难在AD107的基础上提升效率了

我也是这么想的，我感觉4060已经做到效率天花板了。

5GPC以下效率都差不多。SM不变的话性能不会有大提升。

Epilogue · 发表于 2025-2-1 14:03

本帖最后由 Epilogue 于 2025-2-1 14:05 编辑

chungexcy 发表于 2025-2-1 13:58
你等这个月底的评测吧。老黄ppt后面更新了5070ti、5080的ppt，都给改成不到15%了。 ...

我说的ppt就是生化危机4rt那个最新的，最早的ppt除了5090全都是百分之30，然后事实证明只有5090勉强有百分之30。
官网最新的ppt里，5070提升和5070ti一样，所以我好奇你这数据哪来的。

chungexcy · 发表于 2025-2-1 14:08

本帖最后由 chungexcy 于 2025-2-1 14:19 编辑

Epilogue 发表于 2025-2-1 14:03
我说的ppt就是生化危机4rt那个最新的，最早的ppt除了5090全都是百分之30，然后事实证明只有5090勉强有百 ...

我又去看了一下，确实5070也缩了。。。老黄5070ti 对比的是4070ti ，我预测的是5070ti 相对于4070 ti super 提升10-15%，看来15%那边肯定没了。。。

到时候看评测吧，我从逻辑上分析5070至少能多提升一些。可能离4070s还是有5%。

富哥V我五万 · 发表于 2025-2-1 14:16

工艺到了瓶颈，牢黄原地踏步，给了时间追赶，劳苏能不能给点力。

zhoubi · 发表于 2025-2-1 14:21

blackwell拉稀有点像rdna3，都是来自架构的改进取得的收益太低。这次84sm的5080只比80sm的4080强10%多，计算一下每个sm的ipc提升可怜。rdna3也是，号称浮点翻倍，结果cb一测试单个cu比rdna2只强了7%。
这点还要看安培，浮点翻倍做到了单个sm强了快30%。rdna4目前看64cu能打96cu，除开频率因素，每个cu的ipc也有可观的提升。
ipc没啥飞跃，性能提升就只能靠频率了，偏偏无论blackwell还是rdna3，3.5ghz的频率并没有实现

inSeek · 发表于 2025-2-1 14:25

chungexcy 发表于 2025-2-1 13:41
你仔细看 Texture Units，TMU数量也没有提升，跟着SM数量走的。。。4070 是 184 个，5070 是 192 个。

比例是没有提，但是数量提升了的...
你引用的原文里不就有 512 -> 680 么

效率应该也有改进

zealot1 · 发表于 2025-2-1 14:28

nApoleon 发表于 2025-2-1 12:52
5080真实没自宫的400wBIOS其实是有20%的性能提升的…

那提升比不了之前3080和4080提升的幅度

nApoleon · 发表于 2025-2-1 14:29

zealot1 发表于 2025-2-1 14:28
那提升比不了之前3080和4080提升的幅度

没有制程的红利这个提升再结合功耗性能比其实已经很厉害了…

chungexcy · 发表于 2025-2-1 14:32

本帖最后由 chungexcy 于 2025-2-1 14:42 编辑

inSeek 发表于 2025-2-1 14:25
比例是没有提，但是数量提升了的...
你引用的原文里不就有 512 -> 680 么

所以你只能看到5090提升30%的性能。

效率没有特别的变化，至少官方这么说的。

RTX 5090 delivers 1636.76 Gigatexels/sec, compared to 1290.2 Gigatexels per second in RTX 4090.

5070ti打死都摸不到4080，SM 70:76，ROPs 96:112，TMU：280:304

chungexcy · 发表于 2025-2-1 14:34

本帖最后由 chungexcy 于 2025-2-1 15:04 编辑

zhoubi 发表于 2025-2-1 14:21
blackwell拉稀有点像rdna3，都是来自架构的改进取得的收益太低。这次84sm的5080只比80sm的4080强10%多，计 ...

4080 是 76 sm。

rdna4估计是做到了30系的真双倍FP。就像3070的46sm能打2080ti的68sm一样。

64cu的rdna4要是真的做到了，那就相当于12288Cuda的40、50系了。。。

相思风雨中 · 发表于 2025-2-1 14:35

本帖最后由相思风雨中于 2025-2-1 14:38 编辑

赫敏发表于 2025-2-1 13:51
如果是临时拉出来凑数的游戏卡，计算卡岂不是翻车更狠？

GB200跳票/翻车的消息都多久了
BUG太多直接跳到Rubin去了

PPXG · 发表于 2025-2-1 14:43

本帖最后由 PPXG 于 2025-2-1 14:45 编辑

ada refresh不至于，单纯refresh就不需要搞这么多为了AI服务的硬件变动了，以及和微软联合搞的神经网络渲染相关API

另外从steelnomad和speedway提升幅度可以看出Blackwell对DX12U相关特性支持度要更好一些

zexis744 · 发表于 2025-2-1 14:43

本质就是十年前的牢英。
不过可以预期的是有TSMC兜底，制程暂时不会停滞。
就是相比以前的进步幅度会显得很恶心。

chungexcy · 发表于 2025-2-1 14:47

zexis744 发表于 2025-2-1 14:43
本质就是十年前的牢英。
不过可以预期的是有TSMC兜底，制程暂时不会停滞。
就是相比以前的进步幅度会显得很 ...

制程暂时不会停滞，但单位价格的晶体管数目已经不再增长了。。。以后只能用同样的价格买到更小的芯片。。。

Epilogue · 发表于 2025-2-1 14:50

5070ti按照老黄的ppt和tpu的生化危机4rt测试其实已经有个大致答案了，2k下比4080s弱百分之6。tpu没有生化危机4rt的4070的最新数据，所以不知道5070啥水平。

toddler · 发表于 2025-2-1 14:50

简单理解，可以把40升级50系相当于酷睿从13代升级14代，所谓超频不过拉功耗强行提速的操作，400w 功耗对于80系太过爆炸了

chungexcy · 发表于 2025-2-1 14:51

本帖最后由 chungexcy 于 2025-2-1 14:53 编辑

PPXG 发表于 2025-2-1 14:43
ada refresh不至于，单纯refresh就不需要搞这么多为了AI服务的硬件变动了，以及和微软联合搞的神经网络渲染 ...

对游戏而言就是refresh，而且steel nomad 30系的表现也好，你要对比3080 12GB，5080的提升就只有62%了，基本就是规模+频率的幅度。
我感觉steel nomad上，gddr7带来的优势更大。

chungexcy · 发表于 2025-2-1 15:10

Epilogue 发表于 2025-2-1 14:50
5070ti按照老黄的ppt和tpu的生化危机4rt测试其实已经有个大致答案了，2k下比4080s弱百分之6。tpu没有生化危 ...

是的，不过我感觉 5070ti 没有你说的那么乐观，或许2k下拉不太开差距也有可能

T.JOHN · 发表于 2025-2-1 15:28

赫敏发表于 2025-2-1 13:51
如果是临时拉出来凑数的游戏卡，计算卡岂不是翻车更狠？

舅妈说了对，计算卡就是堆规模，软件提升就基本是线性的。重要的是多卡互联的调度和生态。

楼主说的是游戏提升，两年前4090发布时我就发文比较过了，NV效率甜点上限是5-7GPC，也就是ampere那种，满血是7GPC。
4090直接干到了12GPC，然后屏蔽掉一部分SM，效率相比ampere就大大下降。因为4090用了2.6倍的晶体管只换了60%图形性能提升，但是跑AI的时候是线性提升的，证明老黄是计算设计优先图形设计。相比30系，ada还多了optical flow也增加晶体管的，这样多了dlss fg功能。
5090保持了12GPC不变，每个GPC中加了个TPC，这样维持了效率不变，才有了相比4090的线性提升，如果再加GPC，提升更难看。

T.JOHN · 发表于 2025-2-1 15:47

PPXG 发表于 2025-2-1 14:43
ada refresh不至于，单纯refresh就不需要搞这么多为了AI服务的硬件变动了，以及和微软联合搞的神经网络渲染 ...

你可以认为他图形卡就是refresh，只增加1个feature就是mfpg。计算卡增加了fp4支持，为此把fp32改成通用单元。你要知道真计算卡A100/H100都是有独立FP64单元的，和你游戏卡不是一个项目，所以老黄是真把显卡当计算卡卖的。

guanqq_64 · 发表于 2025-2-1 16:05

我有预感我4070tis，超下可能会摸到5070 ti的屁股。

ghgfhghj · 发表于 2025-2-1 16:05

chungexcy 发表于 2025-2-1 14:34
4080 是 76 sm。

rdna4估计是做到了30系的真双倍FP。就像3070的46sm能打2080ti的68sm一样。

3070理论性能根本打不过2080ti，只是老黄不给20系rebar导致2080ti新游戏不行

ghgfhghj · 发表于 2025-2-1 16:11

zhoubi 发表于 2025-2-1 14:21
blackwell拉稀有点像rdna3，都是来自架构的改进取得的收益太低。这次84sm的5080只比80sm的4080强10%多，计 ...

没有30%，3070和2080一样的46sm，一样的显存带宽，多了50%的rops也就强了26%（tpu数据），纯架构改进估计20%

PPXG · 发表于 2025-2-1 16:19

chungexcy 发表于 2025-2-1 14:51
对游戏而言就是refresh，而且steel nomad 30系的表现也好，你要对比3080 12GB，5080的提升就只有62%了， ...

嘛这么说倒也没问题，就是不知道真正利用老黄吹的那堆neural shader相关特性的游戏几时才能普及了。turing当年前瞻性支持DX12U特性放在当时也没什么感觉，都是这么多年下来新游戏越来越多才能看到对比pascal的巨大差距，然而20系早退环境了。。。。。

chungexcy · 发表于 2025-2-1 16:29

本帖最后由 chungexcy 于 2025-2-1 16:31 编辑

ghgfhghj 发表于 2025-2-1 16:05
3070理论性能根本打不过2080ti，只是老黄不给20系rebar导致2080ti新游戏不行

同频确实打不过，显存都差一节。但tpu里面的2080ti其实也和3070差不多，那会儿也还没有新游戏。

主要还是16nm打不过10nm，2080ti相比2080的1.5倍规模，TDP也限制在了250w，11g显存也更耗电，核心频率跑不起来。

但同样rdna4可能也是这种情况，更小的核心配合n4工艺，频率应该能进一步提升，双发射修好了，64cu打打96cu的rdna3还是有可能的。

账号		自动登录	找回密码
密码			加入我们

[显卡] 我来告诉你们为啥50系毫无提升，本质 Ada Refresh。。。