shawnwinton 发表于 2022-12-6 10:33

一张图讨论一下所谓的“CPU瓶颈”

本帖最后由 shawnwinton 于 2022-12-6 19:10 编辑

这几年好几代CPU,无论是intel还是AMD,国内做评测以及电脑商人口中都会来一句:“CPU瓶颈”,我一开始也被洗脑这么认为,直到最近越想越不对:为什么,没有接近100%占用的CPU(通常在50%以下),会出现瓶颈?大家觉得不奇怪吗?

1:CPU瓶颈 基本上被指在1080P下 GPU占用率上不去。(我自己认为无法达到98%以上)

2:很多测试发现,即便CPU主频有效提高(比如ZEN4),瓶颈依然无法有效消除,GPU占用依然无法有效提高。

3:AMD真正能和iu较量的游戏CPU是58X3D,但进入DDR5时代,ZEN4显然很失败,13代很出色(除了功耗)

各位有没有发现,上述2、3条中,有一个基本事实:数据传输效率,也就是内存和CPU之间的效率。

翻译一下:AMD ZEN2开始不断增加三缓,直到58X3D超大三缓,相当于“在内存和CPU之间又建立了一套高速储存设备”,大幅降低对内存的依赖(但不是完全不依赖),所以ZEN3有了和对面PK的能力,但实话说,也没有完全能赢,顶多算有来回,这一点得益于Intel很好的内存效率(高频内存收益大延迟低)。而到了DDR5时代,ZEN4 有一个最严重的缺陷:FLCK,导致DDR5内存效率“大幅度”不如13代,以至于大三缓的优势被抵消,这就是为什么虽然ZEN4主频提高那么多,游戏仍然拉的原因。

下面这张图,虽然这个湾的大家都有争议吧,但是可以参考。各位可以看看GPU占用率,可以证明58X3D超大三缓(数据传输效率的提升)对于消除GPU瓶颈才是最重要的,而不是所谓的“CPU瓶颈”——58X3D的IPC相比ZEN4要弱,却依靠CPU和内存之间额外的有效储存环节(即超大三缓)实现性能飞跃,充分利用了CPU原有的性能(占用到了31%是最高的),减少浪费。

换言之,把DDR5内存超起来的13代,估计在AMD解决flck之前,AMD都无法正面抗衡。



toddler 发表于 2022-12-6 10:43

只有真正在用zen4 的用户才知道性能比zen3 强太多了,而且无视5800x3d,这种内存写入减半的玩意

yubeii 发表于 2022-12-6 10:49

楼主你去看看 4090 的 CPU 横向对比

就知道的确是存在 CPU “瓶颈”

==========

只要显卡足够强大,CPU 就会拖后腿

tmxkkk 发表于 2022-12-6 10:49

增加了我买58x3d的信心,但一直没出手

我现在手握5800x加b550,另外富裕一套4代内存,显卡也有旧货可用,明夏刚需一台电脑,留的也需要保留

请问一下是买个58x3d,再买个一般的b550,还是冲5代内存的新平台

预算有限,偶尔3a,不网游

Hesperus 发表于 2022-12-6 10:52

等一个明年的7000x3d看看游戏性能是不是真能超13代

shawnwinton 发表于 2022-12-6 10:56

yubeii 发表于 2022-12-6 10:49
楼主你去看看 4090 的 CPU 横向对比

就知道的确是存在 CPU “瓶颈”


说实话,简单的归类到“CPU瓶颈”,我认为算对,但是不完全对,只是不准确。毕竟大缓存也是CPU里带的,且内存控制器也在cpu里

momoka 发表于 2022-12-6 10:58

本帖最后由 momoka 于 2022-12-6 11:00 编辑

红字没啥好奇怪的,我司某个知名游戏,长期只能占用2,3个线程,换句话说,就是拿AMD FX8核心,或者肥龙2 6核心,都远远无法满载,但是这不妨碍同期的3770K,4790K   fps比AMD几乎翻倍。


虽然说的比较极端,lz是不是觉得FX 8核心没有满载,就没有cpu瓶颈阿[震惊]

shawnwinton 发表于 2022-12-6 10:58

tmxkkk 发表于 2022-12-6 10:49
增加了我买58x3d的信心,但一直没出手

我现在手握5800x加b550,另外富裕一套4代内存,显卡也有旧货可用, ...

580X 3A足够,主要看你分辨率,高分辨率换U没意义不是很大

PPXG 发表于 2022-12-6 11:05

我5800X打2077和大表哥2帧数明显比朋友13代低,越吃U的场景差距越明显,我大表哥2画质都手动拉到4K全最高了,2077开4K光追DLSS质量甚至有时候显卡占用率都上不去。。。
还有典中典2042只能120帧出头

toddler 发表于 2022-12-6 11:06


5800X3D 这种要看脸的玩具,买新不买旧 不香吗?D4 平台除了高频低延迟的高价货,比不上D5 的









shawnwinton 发表于 2022-12-6 11:07

toddler 发表于 2022-12-6 11:06
5800X3D 这种要看脸的玩具,买新不买旧 不香吗?D4 平台除了高频低延迟的高价货,比不上D5 的




没错 我是说比不了D5

toddler 发表于 2022-12-6 11:09

shawnwinton 发表于 2022-12-6 11:07
没错 我是说比不了D5

zen4 D5平台秒杀老D4 5800X3D

ftsteven 发表于 2022-12-6 11:10

toddler 发表于 2022-12-6 11:06
5800X3D 这种要看脸的玩具,买新不买旧 不香吗?D4 平台除了高频低延迟的高价货,比不上D5 的




X3D牛逼基本是网游上,吃鸡,CSOL,wow等,3A大作也就古墓丽影之类个别几个有优势,按需购买就是了

zcjzcj11111 发表于 2022-12-6 11:13

momoka 发表于 2022-12-6 10:58
红字没啥好奇怪的,我司某个知名游戏,长期只能占用2,3个线程,换句话说,就是拿AMD FX8核心,或者肥龙2 6 ...

[震惊]真相了

huhudna 发表于 2022-12-6 11:13

不同的游戏瓶颈不同。吃cpu算力的58x3d大缓存用处不大。对内存延迟敏感的大缓存就有优势

aibo 发表于 2022-12-6 11:14

cpu瓶颈其实更多的都是单线程瓶颈

这时候看cpu占用率可以很低

shawnwinton 发表于 2022-12-6 11:14

momoka 发表于 2022-12-6 10:58
红字没啥好奇怪的,我司某个知名游戏,长期只能占用2,3个线程,换句话说,就是拿AMD FX8核心,或者肥龙2 6 ...

这么说不太对
当GPU占用率100%的时候,继续提升显卡,帧数会继续提高对吧,直到占用率下降,才能消除GPU瓶颈。
那为什么,同样的理论大家却都不用在CPU身上

yufeiyuejs 发表于 2022-12-6 11:19

tmxkkk 发表于 2022-12-6 10:49
增加了我买58x3d的信心,但一直没出手

我现在手握5800x加b550,另外富裕一套4代内存,显卡也有旧货可用, ...

不网游,那买58x3d?3a都只是偶尔,这台动脑定位是啥

shawnwinton 发表于 2022-12-6 11:20

aibo 发表于 2022-12-6 11:14
cpu瓶颈其实更多的都是单线程瓶颈

这时候看cpu占用率可以很低

现在很少有大作是只用1个核的,监控一下,核心使用基本在9成以上

caoyuxin 发表于 2022-12-6 11:20

yubeii 发表于 2022-12-6 10:49
楼主你去看看 4090 的 CPU 横向对比

就知道的确是存在 CPU “瓶颈”


看测试4090跑2077这种3A大作4K高特效加个光追,瓶颈还是在GPU上。。。。。
现在主流GPU跑3A更是在GPU上了,现在基本上没CPU瓶颈的游戏。哪怕是13代i5,随便带个60fps还是没问题的。。

aibo 发表于 2022-12-6 11:23

shawnwinton 发表于 2022-12-6 11:20
现在很少有大作是只用1个核的,监控一下,核心使用基本在9成以上



多线程优化也不会和不能把所有线程都平均分配到所有核心。

可能线程A需要8G才能让显卡满载
线程B只需要5G
线程C只需要3G

然后根据权重再得出一个最终的帧数。
你很难得到一个纯线性的结果。
但是各种经验和实践上还是,单线程强则强。

momoka 发表于 2022-12-6 11:29

本帖最后由 momoka 于 2022-12-6 11:45 编辑

shawnwinton 发表于 2022-12-6 11:14
这么说不太对
当GPU占用率100%的时候,继续提升显卡,帧数会继续提高对吧,直到占用率下降,才能消除GPU ...

因为游戏程序里,cpu没有那么容易满载,编程困难,有些线程很难拆分,尤其网游。虽然这方面我不太懂,但似乎公司的程序猿表示他们也没办法

这东西有难度和成本,和GPU占用100%完全不是一个等级的。

lionsee123 发表于 2022-12-6 11:33

现代计算机最大的瓶颈永远是IO(每一级IO的速度等级都是差了几倍往上走的,L1到L2到L3),计算电路反而是其次。
要明白一个事情,计算是很快的,过一遍电路就出结果了,但是保存结果,然后基于这个结果再往下算。这个过程中,保存结果,读取结果就是特么最费劲的。
13代的DDR5是可以拉到很高的速度,内存吞吐很高,但是跟3d L3 cache那个速度和延迟是没法比的,都是几倍量级的差距,唯一的问题就是容量。
但是目前根据RDNA2和5800x3d,还有3090及4090的L2容量差距,游戏所需要的Cache容量,的确是多多益善。
两个ccd的7900x3d,32+32+64+64,恐怕要带来一些质变。

zszszs0007 发表于 2022-12-6 11:44

主要是我的钱包瓶颈了

cwl1988212 发表于 2022-12-6 11:49

geenii 发表于 2022-12-6 11:51

除了城市天际线,没有感觉到升级CPU对游戏帧数有什么实质性提升

shawnwinton 发表于 2022-12-6 11:51

lionsee123 发表于 2022-12-6 11:33
现代计算机最大的瓶颈永远是IO(每一级IO的速度等级都是差了几倍往上走的,L1到L2到L3),计算电路反而是其 ...

非常感谢,我也是相似的推断
L3的容量是致命伤同意,性能差距也同意,但解决办法依然是不能只靠L3,内存效率依然很重要,甚至重要性要大于CPU-L3之间的交互,L3和内存之间也会不断交换数据。
2个CCD的79X3D我还是持谨慎态度,主要是不共享3缓在架构上回到ZEN2了?共享这一点比较重要。

Xerxes2 发表于 2022-12-6 12:46

shawnwinton 发表于 2022-12-6 11:51
非常感谢,我也是相似的推断
L3的容量是致命伤同意,性能差距也同意,但解决办法依然是不能只靠L3,内存 ...

……那你知道79x3d一个CCD共享多少L3吗

GSH_ERIC 发表于 2022-12-6 13:01

FLCK是什么鬼

叶子烟 发表于 2022-12-6 13:04

不是所有游戏都能多线程全部用得上的。
CPU瓶颈一般是指的单线程能力。
页: [1] 2
查看完整版本: 一张图讨论一下所谓的“CPU瓶颈”