找回密码
 加入我们
搜索
      
楼主: chungexcy

[显卡] 我来告诉你们为啥50系毫无提升,本质 Ada Refresh。。。

[复制链接]
发表于 2025-2-1 13:56 来自手机 | 显示全部楼层
赫敏 发表于 2025-2-1 13:51
如果是临时拉出来凑数的游戏卡,计算卡岂不是翻车更狠?

计算卡就是堆规模,又不用考虑rops后端问题,上的还是hbm。。。
而且有点趁大家都在炼丹赶紧卖炉子,结果炉子太热了,把人都烤炸了,现在转单去b300了
真提升还得看n3 rubin
 楼主| 发表于 2025-2-1 13:58 | 显示全部楼层
Epilogue 发表于 2025-2-1 13:49
5070按照老黄的ppt,提升不是和5070ti一样么,只有5080是最少的,你这数据是如何得出的? ...

你等这个月底的评测吧。老黄ppt后面更新了5070ti、5080的ppt,都给改成不到15%了。
发表于 2025-2-1 14:00 | 显示全部楼层
chungexcy 发表于 2025-2-1 13:52
除非降价,263 mm2 卖现在这个价格意义不大

其实我比较好奇GB207是什么样子的,感觉很难在AD107的基础上提升效率了
 楼主| 发表于 2025-2-1 14:01 | 显示全部楼层
allensakura 发表于 2025-2-1 13:44
大概率是小幅改进,着重改进内部设计以提升频率
结果最后跟RDNA3一样在3G翻车了
5080要是同功耗下能跑3.5G ...


你这一说我才想起,之前20%的频率提升谣言也没了,更像之前的版本被毙掉了
发表于 2025-2-1 14:01 | 显示全部楼层
其实不难明白,老黄毕竟要考虑长久,要支撑一个几万亿美元市值的公司,必须要有可持续性
可持续性从哪来?
简单啊,明明可以一步走到的事,我给他换成三步走,这样每一步都能赚一次钱
这持续性不就出来了
 楼主| 发表于 2025-2-1 14:03 | 显示全部楼层
BFG9K 发表于 2025-2-1 14:00
其实我比较好奇GB207是什么样子的,感觉很难在AD107的基础上提升效率了


我也是这么想的,我感觉4060已经做到效率天花板了。

5GPC以下效率都差不多。SM不变的话性能不会有大提升。
发表于 2025-2-1 14:03 | 显示全部楼层
本帖最后由 Epilogue 于 2025-2-1 14:05 编辑
chungexcy 发表于 2025-2-1 13:58
你等这个月底的评测吧。老黄ppt后面更新了5070ti、5080的ppt,都给改成不到15%了。 ...


我说的ppt就是生化危机4rt那个最新的,最早的ppt除了5090全都是百分之30,然后事实证明只有5090勉强有百分之30。
官网最新的ppt里,5070提升和5070ti一样,所以我好奇你这数据哪来的。
 楼主| 发表于 2025-2-1 14:08 | 显示全部楼层
本帖最后由 chungexcy 于 2025-2-1 14:19 编辑
Epilogue 发表于 2025-2-1 14:03
我说的ppt就是生化危机4rt那个最新的,最早的ppt除了5090全都是百分之30,然后事实证明只有5090勉强有百 ...


我又去看了一下,确实5070也缩了。。。老黄5070ti 对比的是4070ti ,我预测的是5070ti 相对于4070 ti super 提升10-15%,看来15%那边肯定没了。。。

到时候看评测吧,我从逻辑上分析5070至少能多提升一些。可能离4070s还是有5%。

发表于 2025-2-1 14:16 来自手机 | 显示全部楼层
工艺到了瓶颈,牢黄原地踏步,给了时间追赶,劳苏能不能给点力。
发表于 2025-2-1 14:21 来自手机 | 显示全部楼层
blackwell拉稀有点像rdna3,都是来自架构的改进取得的收益太低。这次84sm的5080只比80sm的4080强10%多,计算一下每个sm的ipc提升可怜。rdna3也是,号称浮点翻倍,结果cb一测试单个cu比rdna2只强了7%。
这点还要看安培,浮点翻倍做到了单个sm强了快30%。rdna4目前看64cu能打96cu,除开频率因素,每个cu的ipc也有可观的提升。
ipc没啥飞跃,性能提升就只能靠频率了,偏偏无论blackwell还是rdna3,3.5ghz的频率并没有实现
发表于 2025-2-1 14:25 | 显示全部楼层
chungexcy 发表于 2025-2-1 13:41
你仔细看 Texture Units,TMU数量也没有提升,跟着SM数量走的。。。4070 是 184 个,5070 是 192 个。

比例是没有提,但是数量提升了的...
你引用的原文里不就有 512 -> 680 么

效率应该也有改进
发表于 2025-2-1 14:28 来自手机 | 显示全部楼层
nApoleon 发表于 2025-2-1 12:52
5080真实没自宫的400wBIOS其实是有20%的性能提升的…

那提升比不了之前3080和4080提升的幅度
发表于 2025-2-1 14:29 来自手机 | 显示全部楼层
zealot1 发表于 2025-2-1 14:28
那提升比不了之前3080和4080提升的幅度

没有制程的红利这个提升再结合功耗性能比其实已经很厉害了…
 楼主| 发表于 2025-2-1 14:32 | 显示全部楼层
本帖最后由 chungexcy 于 2025-2-1 14:42 编辑
inSeek 发表于 2025-2-1 14:25
比例是没有提,但是数量提升了的...
你引用的原文里不就有 512 -> 680 么


所以你只能看到5090提升30%的性能。

效率没有特别的变化,至少官方这么说的。
RTX 5090 delivers 1636.76 Gigatexels/sec, compared to 1290.2 Gigatexels per second in RTX 4090.


5070ti打死都摸不到4080,SM 70:76,ROPs  96:112,TMU:280:304
 楼主| 发表于 2025-2-1 14:34 | 显示全部楼层
本帖最后由 chungexcy 于 2025-2-1 15:04 编辑
zhoubi 发表于 2025-2-1 14:21
blackwell拉稀有点像rdna3,都是来自架构的改进取得的收益太低。这次84sm的5080只比80sm的4080强10%多,计 ...


4080 是 76 sm。

rdna4估计是做到了30系的真双倍FP。就像3070的46sm能打2080ti的68sm一样。

64cu的rdna4要是真的做到了,那就相当于12288Cuda的40、50系了。。。
发表于 2025-2-1 14:35 | 显示全部楼层
本帖最后由 相思风雨中 于 2025-2-1 14:38 编辑
赫敏 发表于 2025-2-1 13:51
如果是临时拉出来凑数的游戏卡,计算卡岂不是翻车更狠?


GB200跳票/翻车的消息都多久了
BUG太多直接跳到Rubin去了
发表于 2025-2-1 14:43 来自手机 | 显示全部楼层
本帖最后由 PPXG 于 2025-2-1 14:45 编辑

ada refresh不至于,单纯refresh就不需要搞这么多为了AI服务的硬件变动了,以及和微软联合搞的神经网络渲染相关API

另外从steelnomad和speedway提升幅度可以看出Blackwell对DX12U相关特性支持度要更好一些
发表于 2025-2-1 14:43 | 显示全部楼层
本质就是十年前的牢英。
不过可以预期的是有TSMC兜底,制程暂时不会停滞。
就是相比以前的进步幅度会显得很恶心。

 楼主| 发表于 2025-2-1 14:47 | 显示全部楼层
zexis744 发表于 2025-2-1 14:43
本质就是十年前的牢英。
不过可以预期的是有TSMC兜底,制程暂时不会停滞。
就是相比以前的进步幅度会显得很 ...

制程暂时不会停滞,但单位价格的晶体管数目已经不再增长了。。。以后只能用同样的价格买到更小的芯片。。。
发表于 2025-2-1 14:50 | 显示全部楼层
5070ti按照老黄的ppt和tpu的生化危机4rt测试其实已经有个大致答案了,2k下比4080s弱百分之6。tpu没有生化危机4rt的4070的最新数据,所以不知道5070啥水平。
发表于 2025-2-1 14:50 | 显示全部楼层
简单理解,可以把40升级50系 相当于酷睿从13代升级14代,所谓超频不过拉功耗强行提速的操作,400w 功耗对于80系太过爆炸了
 楼主| 发表于 2025-2-1 14:51 | 显示全部楼层
本帖最后由 chungexcy 于 2025-2-1 14:53 编辑
PPXG 发表于 2025-2-1 14:43
ada refresh不至于,单纯refresh就不需要搞这么多为了AI服务的硬件变动了,以及和微软联合搞的神经网络渲染 ...


对游戏而言就是refresh,而且steel nomad 30系的表现也好,你要对比3080 12GB,5080的提升就只有62%了,基本就是规模+频率的幅度。
我感觉steel nomad上,gddr7带来的优势更大。
 楼主| 发表于 2025-2-1 15:10 | 显示全部楼层
Epilogue 发表于 2025-2-1 14:50
5070ti按照老黄的ppt和tpu的生化危机4rt测试其实已经有个大致答案了,2k下比4080s弱百分之6。tpu没有生化危 ...

是的,不过我感觉 5070ti 没有你说的那么乐观,或许2k下拉不太开差距也有可能
发表于 2025-2-1 15:28 | 显示全部楼层
赫敏 发表于 2025-2-1 13:51
如果是临时拉出来凑数的游戏卡,计算卡岂不是翻车更狠?

舅妈说了对,计算卡就是堆规模,软件提升就基本是线性的。重要的是多卡互联的调度和生态。

楼主说的是游戏提升,两年前4090发布时我就发文比较过了,NV效率甜点上限是5-7GPC,也就是ampere那种,满血是7GPC。
4090直接干到了12GPC,然后屏蔽掉一部分SM,效率相比ampere就大大下降。因为4090用了2.6倍的晶体管只换了60%图形性能提升,但是跑AI的时候是线性提升的,证明老黄是计算设计优先图形设计。相比30系,ada还多了optical flow也增加晶体管的,这样多了dlss fg功能。
5090保持了12GPC不变,每个GPC中加了个TPC,这样维持了效率不变,才有了相比4090的线性提升,如果再加GPC,提升更难看。
发表于 2025-2-1 15:47 | 显示全部楼层
PPXG 发表于 2025-2-1 14:43
ada refresh不至于,单纯refresh就不需要搞这么多为了AI服务的硬件变动了,以及和微软联合搞的神经网络渲染 ...

你可以认为他图形卡就是refresh,只增加1个feature就是mfpg。计算卡增加了fp4支持,为此把fp32改成通用单元。你要知道真计算卡A100/H100都是有独立FP64单元的,和你游戏卡不是一个项目,所以老黄是真把显卡当计算卡卖的。
发表于 2025-2-1 16:05 | 显示全部楼层
我有预感我4070tis,超下可能会摸到5070 ti的屁股。
发表于 2025-2-1 16:05 | 显示全部楼层
chungexcy 发表于 2025-2-1 14:34
4080 是 76 sm。

rdna4估计是做到了30系的真双倍FP。就像3070的46sm能打2080ti的68sm一样。

3070理论性能根本打不过2080ti,只是老黄不给20系rebar导致2080ti新游戏不行
发表于 2025-2-1 16:11 | 显示全部楼层
zhoubi 发表于 2025-2-1 14:21
blackwell拉稀有点像rdna3,都是来自架构的改进取得的收益太低。这次84sm的5080只比80sm的4080强10%多,计 ...

没有30%,3070和2080一样的46sm,一样的显存带宽,多了50%的rops也就强了26%(tpu数据),纯架构改进估计20%
发表于 2025-2-1 16:19 来自手机 | 显示全部楼层
chungexcy 发表于 2025-2-1 14:51
对游戏而言就是refresh,而且steel nomad 30系的表现也好,你要对比3080 12GB,5080的提升就只有62%了, ...

嘛这么说倒也没问题,就是不知道真正利用老黄吹的那堆neural shader相关特性的游戏几时才能普及了。turing当年前瞻性支持DX12U特性放在当时也没什么感觉,都是这么多年下来新游戏越来越多才能看到对比pascal的巨大差距,然而20系早退环境了。。。。。
 楼主| 发表于 2025-2-1 16:29 | 显示全部楼层
本帖最后由 chungexcy 于 2025-2-1 16:31 编辑
ghgfhghj 发表于 2025-2-1 16:05
3070理论性能根本打不过2080ti,只是老黄不给20系rebar导致2080ti新游戏不行


同频确实打不过,显存都差一节。但tpu里面的2080ti其实也和3070差不多,那会儿也还没有新游戏。

主要还是16nm打不过10nm,2080ti相比2080的1.5倍规模,TDP也限制在了250w,11g显存也更耗电,核心频率跑不起来。

但同样rdna4可能也是这种情况,更小的核心配合n4工艺,频率应该能进一步提升,双发射修好了,64cu打打96cu的rdna3还是有可能的。
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-4-26 04:17 , Processed in 0.013141 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表