找回密码
 加入我们
搜索
      
查看: 8765|回复: 39

[显卡] 4070ti super为什么相比4070ti提升这么小?

[复制链接]
发表于 2024-9-12 09:45 | 显示全部楼层 |阅读模式
本帖最后由 erisk 于 2024-9-12 09:50 编辑

4070ti super相比70ti显存容量增至 16GB,显存位宽为 256 bit,相比4070ti的192 bit大升级,显存带宽大幅提升至 672 GB/s。
4070tisuper 8448个CUDA核心,而4070ti的是 7680个CUDA,也还是有不少提升
为什么我看网上评测,2k,4k性能提升都顶多10%??
微信图片_20240912094634.png
微信图片_20240912094858.png
发表于 2024-9-12 09:50 | 显示全部楼层
再大一点就顶着4080S了
发表于 2024-9-12 09:51 | 显示全部楼层
提升大点,就叫4080ti了
 楼主| 发表于 2024-9-12 09:52 | 显示全部楼层
abbot 发表于 2024-9-12 09:50
再大一点就顶着4080S了

70ti super比80super性能还是落后挺多的,TSE 40super 一般14000+,70ti Super一般12000
发表于 2024-9-12 09:57 | 显示全部楼层
L2还是48MB
发表于 2024-9-12 09:58 | 显示全部楼层
L2砍太严重了,40系的架构设计对L2缓存非常敏感
发表于 2024-9-12 09:58 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
发表于 2024-9-12 09:59 | 显示全部楼层
40系高端卡都受缓存带宽的限制比较严重,4090也是如此,相比4080性能提升小于规模的提升。
发表于 2024-9-12 10:03 | 显示全部楼层
4070ti到4070ti s纯CUDA数量提升也确实就10%,对比4080显存速度慢一点21Gbps对比22.4Gbps,L2差16MB,老黄刀法确实精湛
 楼主| 发表于 2024-9-12 10:04 | 显示全部楼层
gladiator 发表于 2024-9-12 10:03
4070ti到4070ti s纯CUDA数量提升也确实就10%,对比4080显存速度慢一点21Gbps对比22.4Gbps,L2差16MB,老黄 ...

位宽提升感觉影响很小
发表于 2024-9-12 10:05 | 显示全部楼层
4080贵啊。。50出来,会不会降点,乘机捡漏。。
发表于 2024-9-12 10:06 | 显示全部楼层
当初4070ti一堆人诟病192位宽,结果4070ti super提升到256位宽,cuda也增加了,性能就提升那么一点,一堆位宽dang闭嘴了。
发表于 2024-9-12 10:06 | 显示全部楼层
erisk 发表于 2024-9-12 10:04
位宽提升感觉影响很小

我当年觉得4070ti那192bit的显存带宽限制了性能,后来4070tis出来之后 发现应该是那48MB的L2限制的
发表于 2024-9-12 10:09 | 显示全部楼层
4070ti被诟病的的是显存容量,而不是啥192位宽,每次有人嘴硬12g够用我都要发这张图:
E1240CC40A6D19B924B9D31289D321E2.jpg
发表于 2024-9-12 10:10 | 显示全部楼层
这其实就印证了 显存和位宽限制性能的说法是谣言呀  47ts 一出那些人全闭嘴了
发表于 2024-9-12 10:11 | 显示全部楼层
老黄暗搓搓的把L2阉多了
发表于 2024-9-12 10:22 | 显示全部楼层
你是在内涵皮衣刀法精准嘛?
 楼主| 发表于 2024-9-12 10:32 | 显示全部楼层
gubugu2001 发表于 2024-9-12 10:05
4080贵啊。。50出来,会不会降点,乘机捡漏。。

现在二手6000-6500吧
 楼主| 发表于 2024-9-12 10:33 | 显示全部楼层
Epilogue 发表于 2024-9-12 10:09
4070ti被诟病的的是显存容量,而不是啥192位宽,每次有人嘴硬12g够用我都要发这张图:
...

这个差距有点大
发表于 2024-9-12 10:48 | 显示全部楼层
本帖最后由 Epilogue 于 2024-9-12 11:03 编辑

另外不要质疑老黄的刀法,4070s 4070tis 4080s 每张都是百分之15,想多一点都是不可能的。
发表于 2024-9-12 10:51 来自手机 | 显示全部楼层
本帖最后由 chungexcy 于 2024-9-12 10:54 编辑

我反而觉得是sm砍的位置不对

ad103是80sm,我看了die shot图,物理排布是3*12sm+1*8sm+3*12sm,一共7组。其中12sm是2*6,而中间8sm是1*8排布。是一个非常奇葩的排布。

现在砍成66sm,不知道是砍的中间的8sm,还是某一个12sm
发表于 2024-9-12 10:52 | 显示全部楼层
4080S相对4080还要小
发表于 2024-9-12 11:34 | 显示全部楼层
本帖最后由 chungexcy 于 2024-9-12 11:44 编辑

还有,我不认为是48mb的锅。NVIDIA官方曾经说过,ad106下,32mb比2m对比显存压力的提升,只是下降了45%(这个数据应该同时包括了不同缓冲大小命中率和不同大小缓存速度的影响)而已(看图)。

此外,英伟达工程师测试了具有 32 MB L2 缓存的 RTX 4060 Ti 与仅使用 2 MB L2 的 RTX 4060 Ti 的特殊测试版本。

在各种游戏和综合基准测试中,与 2 MB 二级缓存的性能相比,32 MB 二级缓存将显存总线流量平均降低了 50% 以上。这种 50% 的流量减少使 GPU 能够更有效地使用其显存带宽,效率提升可达近 2 倍。因此,在这种情况下,隔离显存性能,具有 288 GB / 秒峰值显存带宽的 Ada GPU 的性能与具有 554 GB / 秒峰值显存带宽的 Ampere GPU 的性能相似。在一系列游戏和综合测试中,大大提高的缓存命中率将游戏帧率提高了高达 34%。



考虑到访存命中率的边际效益(下图的通常情况),2-32之间差了5个等级,2-4-8-16-32。分别减少24%,12%,6%,3%。48和64之间也就仅有1%的影响。当然,这里只是简单计算,也忽略了48mb和64mb的速度差距对百分比的轻微修正,即使考虑到误差,实际上数量级应该是一致的。
发表于 2024-9-12 11:38 | 显示全部楼层
squll009 发表于 2024-9-12 10:06
当初4070ti一堆人诟病192位宽,结果4070ti super提升到256位宽,cuda也增加了,性能就提升那么一点,一堆位 ...

并没有闭嘴,卡吧还是照样位宽至上
发表于 2024-9-12 11:40 | 显示全部楼层
大概率跑AI用,16G显存,比不上4080/S,比4060ti有质的飞跃
发表于 2024-9-12 13:26 | 显示全部楼层
教你如何看懂老黄的刀法。
先有4070ti、4080两张卡
把4070ti削层皮,就是4070s
把4080贴层皮,就是4080s
两张卡加起来对半切,就是4070tis
发表于 2024-9-14 18:07 | 显示全部楼层
LOLI反应堆 发表于 2024-9-12 11:38
并没有闭嘴,卡吧还是照样位宽至上

卡吧出了名的粪坑。
发表于 2024-9-14 19:17 | 显示全部楼层
显存大提升了,性能还想大提升?除非价格也提升叭
发表于 2024-9-14 19:18 | 显示全部楼层
还不是因为老黄的刀又快又狠~~~~
发表于 2024-9-14 19:24 来自手机 | 显示全部楼层
你别管这个性能,显存差4g就是2k和4k的巨大区别。如果你都是拿来2k就当我没说。
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-4-27 07:57 , Processed in 0.013395 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表