erisk 发表于 2024-9-12 09:45

4070ti super为什么相比4070ti提升这么小?

本帖最后由 erisk 于 2024-9-12 09:50 编辑

4070ti super相比70ti显存容量增至 16GB,显存位宽为 256 bit,相比4070ti的192 bit大升级,显存带宽大幅提升至 672 GB/s。
4070tisuper 8448个CUDA核心,而4070ti的是 7680个CUDA,也还是有不少提升
为什么我看网上评测,2k,4k性能提升都顶多10%??

abbot 发表于 2024-9-12 09:50

再大一点就顶着4080S了

firebase 发表于 2024-9-12 09:51

提升大点,就叫4080ti了

erisk 发表于 2024-9-12 09:52

abbot 发表于 2024-9-12 09:50
再大一点就顶着4080S了

70ti super比80super性能还是落后挺多的,TSE 40super 一般14000+,70ti Super一般12000

PPXG 发表于 2024-9-12 09:57

L2还是48MB

Scarlet〃 发表于 2024-9-12 09:58

L2砍太严重了,40系的架构设计对L2缓存非常敏感

gbawrc 发表于 2024-9-12 09:58

sthuasheng 发表于 2024-9-12 09:59

40系高端卡都受缓存带宽的限制比较严重,4090也是如此,相比4080性能提升小于规模的提升。

gladiator 发表于 2024-9-12 10:03

4070ti到4070ti s纯CUDA数量提升也确实就10%,对比4080显存速度慢一点21Gbps对比22.4Gbps,L2差16MB,老黄刀法确实精湛[偷笑]

erisk 发表于 2024-9-12 10:04

gladiator 发表于 2024-9-12 10:03
4070ti到4070ti s纯CUDA数量提升也确实就10%,对比4080显存速度慢一点21Gbps对比22.4Gbps,L2差16MB,老黄 ...

位宽提升感觉影响很小

gubugu2001 发表于 2024-9-12 10:05

4080贵啊。。50出来,会不会降点,乘机捡漏。。

squll009 发表于 2024-9-12 10:06

当初4070ti一堆人诟病192位宽,结果4070ti super提升到256位宽,cuda也增加了,性能就提升那么一点,一堆位宽dang闭嘴了。

gladiator 发表于 2024-9-12 10:06

erisk 发表于 2024-9-12 10:04
位宽提升感觉影响很小

我当年觉得4070ti那192bit的显存带宽限制了性能,后来4070tis出来之后 发现应该是那48MB的L2限制的[偷笑]

Epilogue 发表于 2024-9-12 10:09

4070ti被诟病的的是显存容量,而不是啥192位宽,每次有人嘴硬12g够用我都要发这张图:

NullPointerExce 发表于 2024-9-12 10:10

这其实就印证了 显存和位宽限制性能的说法是谣言呀47ts 一出那些人全闭嘴了

土星实验室 发表于 2024-9-12 10:11

老黄暗搓搓的把L2阉多了

jacksting 发表于 2024-9-12 10:22

你是在内涵皮衣刀法精准嘛?

erisk 发表于 2024-9-12 10:32

gubugu2001 发表于 2024-9-12 10:05
4080贵啊。。50出来,会不会降点,乘机捡漏。。

现在二手6000-6500吧

erisk 发表于 2024-9-12 10:33

Epilogue 发表于 2024-9-12 10:09
4070ti被诟病的的是显存容量,而不是啥192位宽,每次有人嘴硬12g够用我都要发这张图:
...

这个差距有点大

Epilogue 发表于 2024-9-12 10:48

本帖最后由 Epilogue 于 2024-9-12 11:03 编辑

另外不要质疑老黄的刀法,4070s 4070tis 4080s 每张都是百分之15,想多一点都是不可能的。[再见]

chungexcy 发表于 2024-9-12 10:51

本帖最后由 chungexcy 于 2024-9-12 10:54 编辑

我反而觉得是sm砍的位置不对

ad103是80sm,我看了die shot图,物理排布是3*12sm+1*8sm+3*12sm,一共7组。其中12sm是2*6,而中间8sm是1*8排布。是一个非常奇葩的排布。
https://substackcdn.com/image/fetch/f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fbucketeer-e05bbc84-baa3-437e-9518-adb32be77984.s3.amazonaws.com%2Fpublic%2Fimages%2Faa4a16a2-779f-45fd-906c-3b5f7db61786_1920x1017.jpeg
现在砍成66sm,不知道是砍的中间的8sm,还是某一个12sm

ZLOT2V2 发表于 2024-9-12 10:52

4080S相对4080还要小

chungexcy 发表于 2024-9-12 11:34

本帖最后由 chungexcy 于 2024-9-12 11:44 编辑

还有,我不认为是48mb的锅。NVIDIA官方曾经说过,ad106下,32mb比2m对比显存压力的提升,只是下降了45%(这个数据应该同时包括了不同缓冲大小命中率和不同大小缓存速度的影响)而已(看图)。

此外,英伟达工程师测试了具有 32 MB L2 缓存的 RTX 4060 Ti 与仅使用 2 MB L2 的 RTX 4060 Ti 的特殊测试版本。

在各种游戏和综合基准测试中,与 2 MB 二级缓存的性能相比,32 MB 二级缓存将显存总线流量平均降低了 50% 以上。这种 50% 的流量减少使 GPU 能够更有效地使用其显存带宽,效率提升可达近 2 倍。因此,在这种情况下,隔离显存性能,具有 288 GB / 秒峰值显存带宽的 Ada GPU 的性能与具有 554 GB / 秒峰值显存带宽的 Ampere GPU 的性能相似。在一系列游戏和综合测试中,大大提高的缓存命中率将游戏帧率提高了高达 34%。
https://img.ithome.com/newsuploadfiles/2023/5/5f7edac8-3dab-4a89-8b8d-3f6e269c8d00.png

考虑到访存命中率的边际效益(下图的通常情况),2-32之间差了5个等级,2-4-8-16-32。分别减少24%,12%,6%,3%。48和64之间也就仅有1%的影响。当然,这里只是简单计算,也忽略了48mb和64mb的速度差距对百分比的轻微修正,即使考虑到误差,实际上数量级应该是一致的。
https://www.researchgate.net/profile/Sultan-Almakdi/publication/273577255/figure/fig2/AS:391867536560129@1470439909191/Hit-rate-vs-cache-size.png

LOLI反应堆 发表于 2024-9-12 11:38

squll009 发表于 2024-9-12 10:06
当初4070ti一堆人诟病192位宽,结果4070ti super提升到256位宽,cuda也增加了,性能就提升那么一点,一堆位 ...

并没有闭嘴,卡吧还是照样位宽至上[恶魔]

h125445797 发表于 2024-9-12 11:40

大概率跑AI用,16G显存,比不上4080/S,比4060ti有质的飞跃

zhaofire 发表于 2024-9-12 13:26

教你如何看懂老黄的刀法。
先有4070ti、4080两张卡
把4070ti削层皮,就是4070s
把4080贴层皮,就是4080s
两张卡加起来对半切,就是4070tis

squll009 发表于 2024-9-14 18:07

LOLI反应堆 发表于 2024-9-12 11:38
并没有闭嘴,卡吧还是照样位宽至上

卡吧出了名的粪坑。

richienie 发表于 2024-9-14 19:17

显存大提升了,性能还想大提升?除非价格也提升叭[恶魔]

44434610 发表于 2024-9-14 19:18

还不是因为老黄的刀又快又狠~~~~[狂笑]

qiuhepeng 发表于 2024-9-14 19:24

你别管这个性能,显存差4g就是2k和4k的巨大区别。如果你都是拿来2k就当我没说。
页: [1] 2
查看完整版本: 4070ti super为什么相比4070ti提升这么小?