Nvidia: A Deeper Look At VRAM On GeForce RTX 40 Series Graphics Cards
本帖最后由 dange66 于 2023-5-19 18:43 编辑英伟达在RTX4060/60ti发布之际写了一篇文章专门阐释了显存子系统在RTX系列显卡中的背后设计意图以及各方权衡.
其中有个很有意思的点.
原文地址: https://www.nvidia.com/en-us/geforce/news/rtx-40-series-vram-video-memory-explained/
NVIDIA engineers tested the RTX 4060 Ti with its 32 MB L2 cache against a special test version of RTX 4060 Ti using only a 2 MB L2.
In testing with a variety of games and synthetic benchmarks, the 32 MB L2 cache reduced memory bus traffic by just over 50% on average compared to the performance of a 2 MB L2 cache.
in this scenario, isolating for memory performance, an Ada GPU with 288 GB/sec of peak memory bandwidth would perform similarly to an Ampere GPU with 554 GB/sec of peak memory bandwidth
32MB的L2相对于2MB版本在测试中平均减少了大约50%的访存需求, 就显存性能而言: Ada 288GB/s vs Ampere 544GB/s的表现相当
(苏妈直拍大腿[傻笑] .
话说70-class的192bit也为人诟病怎么没有对应的数据出来,还是他们觉得2023年推出一个3000+价格的128bit显卡是真的难为情[恶魔]
苏妈也出个PPT啊 这东西就看实际性能,具体多少bit对于游戏玩家没那么大意义,最重要在于卖的太贵。。。性价比太低 天空兽:爆缓存辣 panzerlied 发表于 2023-5-19 19:12
天空兽:爆缓存辣
? 不知道测没测2k、4k下的情况,缓存效能衰减多少,跟3060ti G6X比一比 RTX 3D 学苏麻的 hashtag #奇文共赏 #哪壶不开提哪壶 #开DLSS开的
Altogether, the tech specs deliver a great 60-class GPU with high performance for 1080p gamers, who account for the majority of Steam users. 堕落的翼 发表于 2023-5-19 20:19
hashtag #奇文共赏 #哪壶不开提哪壶 #开DLSS开的
但其实4060Ti 8G也不能稳1080P下今年的3A了,显存给爆麻了 那么还有人会买吗? BFG9K 发表于 2023-5-19 20:57
但其实4060Ti 8G也不能稳1080P下今年的3A了,显存给爆麻了
老黄的意思是让你开DLSS3玩1080P,帧数不够就FG补上去(不是 本帖最后由 PPXG 于 2023-5-19 21:19 编辑
老黄这文章图一乐,向非系统性学习过体系结构的大众士科普GPU内存缓存体系倒是还行
4060Ti的核心理论计算性能大约是3060Ti的125%,即使“effective bandwidth”比3060Ti更高,但是实际提升更低,看图without FG那段肯定没有25%。
4060Ti 32MB对比2MB up to 34%是开了DLSS3的,RT是25%,no RT是18%。
而且那个表格是1080 1440 2160的平均提升,1080P实际会更高点,2160P实际会更低点 堕落的翼 发表于 2023-5-19 21:13
老黄的意思是让你开DLSS3玩1080P,帧数不够就FG补上去(不是
1080P开dlss真的很痛苦
现在全新的6800也就3000一张,比nv这些乱七八糟的花头实用多了 苏妈拍什么大腿,这不是她玩剩下的么
老黃這次的定價太感人,自家PR都覺得不好意思要出來尬紹一下[狂笑] BFG9K 发表于 2023-5-19 21:23
1080P开dlss真的很痛苦
现在全新的6800也就3000一张,比nv这些乱七八糟的花头实用多了 ...
唉,老黄[再见] texnis 发表于 2023-5-19 19:59
不知道测没测2k、4k下的情况,缓存效能衰减多少,跟3060ti G6X比一比
2k、4k下肯定暴跌啊,一共就32M的L2,太难为它了,4k下被3060ti G6X反杀也是正常情况 别他妈装了我看你这显存的牙膏能挤多久 开 DLSS 都是搞矩阵计算,当然省显存了~
真要玩缓存流,建议 CPU 和 GPU 整一个 shared cache (SRAM) 存热点数据,弄好了相同浮点算力性能起码飙 30% 往上走~ 本帖最后由 用户 于 2023-5-20 01:23 编辑
BFG9K 发表于 2023-5-19 20:57
但其实4060Ti 8G也不能稳1080P下今年的3A了,显存给爆麻了
几年前看到一篇文章说raja koduri和tim sweeney聊硬件的问题,说游戏都是几秒钟内要换几个gb级的场景。别说8gb不够,可能很快16gb也会爆。比如8gb 5秒爆,16gb 10秒爆。最后还得去硬盘上读 ppipip110 发表于 2023-5-19 06:08
苏妈的是l3吧,速度要慢
L3不一定比L2慢,看实现 用户 发表于 2023-5-20 01:21
几年前看到一篇文章说raja koduri和tim sweeney聊硬件的问题,说游戏都是几秒钟内要换几个gb级的场景。别 ...
问题是现在同场景都放不下来 对于游戏玩家来说,很多时候需要的不是显存访问速度而是显存容量
他显存速率做慢一点,容量大一点,其实就不会有什么影响了 个人觉得没啥问题,你做事不也是把优点一顿吹,缺点一笔带过吗?
L2 缓存比之前的旗舰卡大是事实,你只能说老黄没料到 DRAM 过去 3 年跌了 3 倍价格,而自己在芯片上刻的缓存成本 TSMC 可是一分不少。
反而走大显存路子的成本倒是更低了。 panzerlied 发表于 2023-5-19 19:12
天空兽:爆缓存辣
天空与大地之兽:
你cue我做啥?https://cdn.jsdelivr.net/gh/master-of-forums/master-of-forums/public/images/patch.gif 2202年的6750xt没记错是192bit的4199吧 tq7c1xj 发表于 2023-5-20 09:57
现在内存dram 价格暴跌,还做chip上面的缓存浪费钱?学intel 配上 16g gddr6 量大管饱,便宜大碗才是真,消 ...
[困惑]他不是做了两版本吗,8G跟16G4060TI 1080p only~
页:
[1]