Chiphell - 分享与交流用户体验

标题: 一张图讨论一下所谓的“CPU瓶颈” [打印本页]

作者: shawnwinton    时间: 2022-12-6 10:33
标题: 一张图讨论一下所谓的“CPU瓶颈”
本帖最后由 shawnwinton 于 2022-12-6 19:10 编辑

这几年好几代CPU,无论是intel还是AMD,国内做评测以及电脑商人口中都会来一句:“CPU瓶颈”,我一开始也被洗脑这么认为,直到最近越想越不对:为什么,没有接近100%占用的CPU(通常在50%以下),会出现瓶颈?大家觉得不奇怪吗?

1:CPU瓶颈 基本上被指在1080P下 GPU占用率上不去。(我自己认为无法达到98%以上)

2:很多测试发现,即便CPU主频有效提高(比如ZEN4),瓶颈依然无法有效消除,GPU占用依然无法有效提高。

3:AMD真正能和iu较量的游戏CPU是58X3D,但进入DDR5时代,ZEN4显然很失败,13代很出色(除了功耗)

各位有没有发现,上述2、3条中,有一个基本事实:数据传输效率,也就是内存和CPU之间的效率。

翻译一下:AMD ZEN2开始不断增加三缓,直到58X3D超大三缓,相当于“在内存和CPU之间又建立了一套高速储存设备”,大幅降低对内存的依赖(但不是完全不依赖),所以ZEN3有了和对面PK的能力,但实话说,也没有完全能赢,顶多算有来回,这一点得益于Intel很好的内存效率(高频内存收益大延迟低)。而到了DDR5时代,ZEN4 有一个最严重的缺陷:FLCK,导致DDR5内存效率“大幅度”不如13代,以至于大三缓的优势被抵消,这就是为什么虽然ZEN4主频提高那么多,游戏仍然拉的原因。

下面这张图,虽然这个湾的大家都有争议吧,但是可以参考。各位可以看看GPU占用率,可以证明58X3D超大三缓(数据传输效率的提升)对于消除GPU瓶颈才是最重要的,而不是所谓的“CPU瓶颈”——58X3D的IPC相比ZEN4要弱,却依靠CPU和内存之间额外的有效储存环节(即超大三缓)实现性能飞跃,充分利用了CPU原有的性能(占用到了31%是最高的),减少浪费。

换言之,把DDR5内存超起来的13代,估计在AMD解决flck之前,AMD都无法正面抗衡。

(, 下载次数: 61)


作者: toddler    时间: 2022-12-6 10:43
只有真正在用zen4 的用户才知道性能比zen3 强太多了,而且无视5800x3d,这种内存写入减半的玩意
作者: yubeii    时间: 2022-12-6 10:49
楼主你去看看 4090 的 CPU 横向对比

就知道的确是存在 CPU “瓶颈”

==========

只要显卡足够强大,CPU 就会拖后腿
作者: tmxkkk    时间: 2022-12-6 10:49
增加了我买58x3d的信心,但一直没出手

我现在手握5800x加b550,另外富裕一套4代内存,显卡也有旧货可用,明夏刚需一台电脑,留的也需要保留

请问一下是买个58x3d,再买个一般的b550,还是冲5代内存的新平台

预算有限,偶尔3a,不网游
作者: Hesperus    时间: 2022-12-6 10:52
等一个明年的7000x3d看看游戏性能是不是真能超13代
作者: shawnwinton    时间: 2022-12-6 10:56
yubeii 发表于 2022-12-6 10:49
楼主你去看看 4090 的 CPU 横向对比

就知道的确是存在 CPU “瓶颈”

说实话,简单的归类到“CPU瓶颈”,我认为算对,但是不完全对,只是不准确。毕竟大缓存也是CPU里带的,且内存控制器也在cpu里
作者: momoka    时间: 2022-12-6 10:58
本帖最后由 momoka 于 2022-12-6 11:00 编辑

红字没啥好奇怪的,我司某个知名游戏,长期只能占用2,3个线程,换句话说,就是拿AMD FX8核心,或者肥龙2 6核心,都远远无法满载,但是这不妨碍同期的3770K,4790K   fps比AMD几乎翻倍。


虽然说的比较极端,lz是不是觉得FX 8核心没有满载,就没有cpu瓶颈阿

作者: shawnwinton    时间: 2022-12-6 10:58
tmxkkk 发表于 2022-12-6 10:49
增加了我买58x3d的信心,但一直没出手

我现在手握5800x加b550,另外富裕一套4代内存,显卡也有旧货可用, ...

580X 3A足够,主要看你分辨率,高分辨率换U没意义不是很大
作者: PPXG    时间: 2022-12-6 11:05
我5800X打2077和大表哥2帧数明显比朋友13代低,越吃U的场景差距越明显,我大表哥2画质都手动拉到4K全最高了,2077开4K光追DLSS质量甚至有时候显卡占用率都上不去。。。
还有典中典2042只能120帧出头
作者: toddler    时间: 2022-12-6 11:06

5800X3D 这种要看脸的玩具,买新不买旧 不香吗?D4 平台除了高频低延迟的高价货,比不上D5 的
(, 下载次数: 69)
(, 下载次数: 67)
(, 下载次数: 63)

(, 下载次数: 63)
(, 下载次数: 75)




作者: shawnwinton    时间: 2022-12-6 11:07
toddler 发表于 2022-12-6 11:06
5800X3D 这种要看脸的玩具,买新不买旧 不香吗?D4 平台除了高频低延迟的高价货,比不上D5 的

没错 我是说比不了D5
作者: toddler    时间: 2022-12-6 11:09
shawnwinton 发表于 2022-12-6 11:07
没错 我是说比不了D5

zen4 D5平台秒杀老D4 5800X3D
作者: ftsteven    时间: 2022-12-6 11:10
toddler 发表于 2022-12-6 11:06
5800X3D 这种要看脸的玩具,买新不买旧 不香吗?D4 平台除了高频低延迟的高价货,比不上D5 的



X3D牛逼基本是网游上,吃鸡,CSOL,wow等,3A大作也就古墓丽影之类个别几个有优势,按需购买就是了
作者: zcjzcj11111    时间: 2022-12-6 11:13
momoka 发表于 2022-12-6 10:58
红字没啥好奇怪的,我司某个知名游戏,长期只能占用2,3个线程,换句话说,就是拿AMD FX8核心,或者肥龙2 6 ...

真相了
作者: huhudna    时间: 2022-12-6 11:13
不同的游戏瓶颈不同。吃cpu算力的58x3d大缓存用处不大。对内存延迟敏感的大缓存就有优势
作者: aibo    时间: 2022-12-6 11:14
cpu瓶颈其实更多的都是单线程瓶颈

这时候看cpu占用率可以很低
作者: shawnwinton    时间: 2022-12-6 11:14
momoka 发表于 2022-12-6 10:58
红字没啥好奇怪的,我司某个知名游戏,长期只能占用2,3个线程,换句话说,就是拿AMD FX8核心,或者肥龙2 6 ...

这么说不太对
当GPU占用率100%的时候,继续提升显卡,帧数会继续提高对吧,直到占用率下降,才能消除GPU瓶颈。
那为什么,同样的理论大家却都不用在CPU身上
作者: yufeiyuejs    时间: 2022-12-6 11:19
tmxkkk 发表于 2022-12-6 10:49
增加了我买58x3d的信心,但一直没出手

我现在手握5800x加b550,另外富裕一套4代内存,显卡也有旧货可用, ...

不网游,那买58x3d?3a都只是偶尔,这台动脑定位是啥
作者: shawnwinton    时间: 2022-12-6 11:20
aibo 发表于 2022-12-6 11:14
cpu瓶颈其实更多的都是单线程瓶颈

这时候看cpu占用率可以很低

现在很少有大作是只用1个核的,监控一下,核心使用基本在9成以上
作者: caoyuxin    时间: 2022-12-6 11:20
yubeii 发表于 2022-12-6 10:49
楼主你去看看 4090 的 CPU 横向对比

就知道的确是存在 CPU “瓶颈”

看测试4090跑2077这种3A大作4K高特效加个光追,瓶颈还是在GPU上。。。。。
现在主流GPU跑3A更是在GPU上了,现在基本上没CPU瓶颈的游戏。哪怕是13代i5,随便带个60fps还是没问题的。。
作者: aibo    时间: 2022-12-6 11:23
shawnwinton 发表于 2022-12-6 11:20
现在很少有大作是只用1个核的,监控一下,核心使用基本在9成以上




多线程优化也不会和不能把所有线程都平均分配到所有核心。

可能线程A需要8G才能让显卡满载
线程B只需要5G
线程C只需要3G

然后根据权重再得出一个最终的帧数。
你很难得到一个纯线性的结果。
但是各种经验和实践上还是,单线程强则强。
作者: momoka    时间: 2022-12-6 11:29
本帖最后由 momoka 于 2022-12-6 11:45 编辑
shawnwinton 发表于 2022-12-6 11:14
这么说不太对
当GPU占用率100%的时候,继续提升显卡,帧数会继续提高对吧,直到占用率下降,才能消除GPU ...


因为游戏程序里,cpu没有那么容易满载,编程困难,有些线程很难拆分,尤其网游。虽然这方面我不太懂,但似乎公司的程序猿表示他们也没办法

这东西有难度和成本,和GPU占用100%完全不是一个等级的。
作者: lionsee123    时间: 2022-12-6 11:33
现代计算机最大的瓶颈永远是IO(每一级IO的速度等级都是差了几倍往上走的,L1到L2到L3),计算电路反而是其次。
要明白一个事情,计算是很快的,过一遍电路就出结果了,但是保存结果,然后基于这个结果再往下算。这个过程中,保存结果,读取结果就是特么最费劲的。
13代的DDR5是可以拉到很高的速度,内存吞吐很高,但是跟3d L3 cache那个速度和延迟是没法比的,都是几倍量级的差距,唯一的问题就是容量。
但是目前根据RDNA2和5800x3d,还有3090及4090的L2容量差距,游戏所需要的Cache容量,的确是多多益善。
两个ccd的7900x3d,32+32+64+64,恐怕要带来一些质变。
作者: zszszs0007    时间: 2022-12-6 11:44
主要是我的钱包瓶颈了
作者: cwl1988212    时间: 2022-12-6 11:49
提示: 作者被禁止或删除 内容自动屏蔽
作者: geenii    时间: 2022-12-6 11:51
除了城市天际线,没有感觉到升级CPU对游戏帧数有什么实质性提升
作者: shawnwinton    时间: 2022-12-6 11:51
lionsee123 发表于 2022-12-6 11:33
现代计算机最大的瓶颈永远是IO(每一级IO的速度等级都是差了几倍往上走的,L1到L2到L3),计算电路反而是其 ...

非常感谢,我也是相似的推断
L3的容量是致命伤同意,性能差距也同意,但解决办法依然是不能只靠L3,内存效率依然很重要,甚至重要性要大于CPU-L3之间的交互,L3和内存之间也会不断交换数据。
2个CCD的79X3D我还是持谨慎态度,主要是不共享3缓在架构上回到ZEN2了?共享这一点比较重要。
作者: Xerxes2    时间: 2022-12-6 12:46
shawnwinton 发表于 2022-12-6 11:51
非常感谢,我也是相似的推断
L3的容量是致命伤同意,性能差距也同意,但解决办法依然是不能只靠L3,内存 ...

……那你知道79x3d一个CCD共享多少L3吗
作者: GSH_ERIC    时间: 2022-12-6 13:01
FLCK是什么鬼
作者: 叶子烟    时间: 2022-12-6 13:04
不是所有游戏都能多线程全部用得上的。
CPU瓶颈一般是指的单线程能力。
作者: bigeblis    时间: 2022-12-6 13:05
提示: 作者被禁止或删除 内容自动屏蔽
作者: cloud    时间: 2022-12-6 13:09
bigeblis 发表于 2022-12-6 13:05
看了你的对比图,我觉得现在用的DDR4000 CL17一点都不虚DDR6000啊!更何况你这个图还是1080p对比,换成4K ...

https://www.zhihu.com/question/555969048/answer/2723462911

我觉得可以看看我13代测试的游戏部分 都是4K 虽然没MAX也基本是ULTRA画质

里面有瓶颈的分析
作者: bigeblis    时间: 2022-12-6 13:12
提示: 作者被禁止或删除 内容自动屏蔽
作者: tjmxxo    时间: 2022-12-6 13:26
建议了解一下windows任务管理器那个cpu占用是怎么算的
作者: cloud    时间: 2022-12-6 13:32
bigeblis 发表于 2022-12-6 13:12
瞧瞧去
最近正在纠结要不要换到D5平台

我当时测试用的6400 测试完了以后才有adie
作者: lionsee123    时间: 2022-12-6 13:33
shawnwinton 发表于 2022-12-6 11:51
非常感谢,我也是相似的推断
L3的容量是致命伤同意,性能差距也同意,但解决办法依然是不能只靠L3,内存 ...

  我个人觉得就是那道小学题:一个池子一边放水一边进水,需要多少时间进满。

  双CCD的x3d cache L3会让一个CPU拥有192mb的缓存,单从游戏上而言,这恐怕已经足够放下大量核心代码实例化后的对象了。一旦满足了热点对象的高速缓存,那么剩下的在内存里也足够了。

  你说的提高内存速率,也很正确,但是100Gbps的内存读写速率和80Gbps的内存读写速率,究竟快还是慢,合适不合适,得看他对应的计算核心配套是否吻合。目前而言,zen4架构的计算吞吐问题,恐怕也有大量的实验可以得知。

  而这主要提升的就是每个计算周期内的暂存情况,通过直接减少读取内存提高缓存命中率,减少每个计算周期内的CPU等待时间,变相提高其计算单元的计算效率,减少线程流水线上的空泡,这也是加cache的普遍思路。

  等到再加L3提升游戏帧率的收益越来越低后,就说明了瓶颈不在IO这边了,到计算架构那边的问题了。这个可以观察新的7900x3D和7800x3D进行对比,后续肯定有实验。
作者: alangl    时间: 2022-12-6 13:39
也得看游戏的优化,战地2042这个变态的游戏,10900k 128人地图 20个线程吃满100%占用帧数比多核心调度更好的7960x帧数少了50%,以后游戏要是都能有这么好的优化,没必要mainstream了。直接捡hedt的垃圾就行了
作者: lh4357    时间: 2022-12-6 14:03
其实我也挺想知道所谓的GPU占用100%是啥原理。
(, 下载次数: 47)
这是4090拖1080P最高画质的2077。
占用也接近100了,但功耗离上限还远着呢。

作者: lh4357    时间: 2022-12-6 14:05
lionsee123 发表于 2022-12-6 13:33
我个人觉得就是那道小学题:一个池子一边放水一边进水,需要多少时间进满。

  双CCD的x3d cache L3会 ...

所以我一直想知道拿7773X玩游戏,是啥效能。
可惜这玩意太贵。
作者: locoroco    时间: 2022-12-6 14:18
电竞类游戏测试是这样的

3A CPU不是太差的级别差距可以基本可以忽略
反正我认为旗舰显卡的表现
分辨率必须是4K起步,花这么多钱还1080P
知道测试意图,但实际使用。。
作者: 三城六号    时间: 2022-12-6 14:48
shawnwinton 发表于 2022-12-6 11:14
这么说不太对
当GPU占用率100%的时候,继续提升显卡,帧数会继续提高对吧,直到占用率下降,才能消除GPU ...

因为游戏用不全CPU的线程数,但是能用满显卡。
一个4线程的处理器,游戏用满其中两个,占用率也才50%,如果升级到8线程处理器,反而会变成占用率25%
作者: 守护灬纯洁之心    时间: 2022-12-6 15:01
你说得对,准确来说,只有两个情况
1. GPU瓶颈,提升GPU本身的性能即可获得提升(比如超频,加规格,加功耗)
2.非GPU瓶颈
第二点就很多了,从GPU核心到CPU核心这条路上全部遇到的玩意都可能会造成瓶颈,比如PCIe带宽,比如显存带宽,比如内存带宽,比如Ring/IF,比如L3
到最后才是CPU核心本身
很多时候CPU频率上去,帧数得到了提升,这个或许是让L1/L2/L3/Ring/IF这些得到了提升带来的,并非是真·核心处理性能提升
这也是为啥超内存有帮助,换大L3有帮助
作者: jacksting    时间: 2022-12-6 15:09
这个评测有点偏颇。

都用上90系了,难道还用1080小屏幕或者32寸大果粒?1个90系显卡都能买10个1080p显示器了。

90系对应的屏幕起步也要2K 144HZ吧,用上4K 240HZ是不是瓶颈就转到显卡了。
作者: melancholy05    时间: 2022-12-6 16:27
这楼里没有一个人在意0.1% low帧数吗
作者: 林间有新绿    时间: 2022-12-6 16:30
我只说一个 之前5900x配4090跑老版本鲁大师显卡95万  换7950x后115w 但是4k下没区别 2077都是只有40帧
作者: shenqingyi    时间: 2022-12-6 16:35
本帖最后由 shenqingyi 于 2022-12-6 16:47 编辑
shawnwinton 发表于 2022-12-6 11:14
这么说不太对
当GPU占用率100%的时候,继续提升显卡,帧数会继续提高对吧,直到占用率下降,才能消除GPU ...


其实整天看GPU占用是不是99%纯属吃饱了撑的,我只关注游戏能否达到我想要的流畅帧数。达到了我管它CPU是不是瓶颈呢。
作者: 云无心    时间: 2022-12-6 16:39
toddler 发表于 2022-12-6 10:43
只有真正在用zen4 的用户才知道性能比zen3 强太多了,而且无视5800x3d,这种内存写入减半的玩意 ...

所以游戏无敌U很可能是5900X3D?  192的三缓    搭配高频DDR5    网游无敌U?
作者: csqaclp    时间: 2022-12-6 17:31
网游cpu瓶颈很明显
12490f  1660ti
1080p 永劫无间无尽模式和pubg自闭城显卡跑不满
作者: shawnwinton    时间: 2022-12-6 18:34
三城六号 发表于 2022-12-6 14:48
因为游戏用不全CPU的线程数,但是能用满显卡。
一个4线程的处理器,游戏用满其中两个,占用率也才50%,如 ...

(, 下载次数: 34)
作者: redtears    时间: 2022-12-6 18:51
58x3d最大的问题是WZ2和2042这种玩意儿会把占用拉爆
作者: shawnwinton    时间: 2022-12-6 18:57
守护灬纯洁之心 发表于 2022-12-6 15:01
你说得对,准确来说,只有两个情况
1. GPU瓶颈,提升GPU本身的性能即可获得提升(比如超频,加规格,加功耗 ...

是的,其实想想 intel和AMD(尤其是AMD)如此坚决的转进DDR5,应该是CPU现在靠工艺、架构带动IPC提升的能力越来越小了,解决之道还得是高频DDR5
作者: 田上天下    时间: 2022-12-6 19:04
提示: 作者被禁止或删除 内容自动屏蔽
作者: shawnwinton    时间: 2022-12-6 19:26
本帖最后由 shawnwinton 于 2022-12-6 19:27 编辑
cloud 发表于 2022-12-6 13:09
https://www.zhihu.com/question/555969048/answer/2723462911

我觉得可以看看我13代测试的游戏部分 都 ...


判断游戏CPU瓶颈的方法不是看CPU占用率占满没,而是应该反过来看GPU的占用率,如果GPU占用率不满,就说明GPU FPS低于CPU FPS,性能发挥被限制。

这是你的原文,按照原来的思维这句话是没错的,但就如23# 42#楼的回复,原因并不能完全归咎与CPU,很常见的例子,我换了XXCPU+XX显卡后帧数和以前一样等等,我发这贴的大概意思是想说:内存(和三缓)效率对于瓶颈的影响很大,而直接说CPU瓶颈似乎不准确,虽然它们跟CPU的设计有直接关系。
作者: wawa    时间: 2022-12-6 19:33
我双11帮朋友装了5800x3d,配的金百达3600 c16
和我自己用的13700k对比了下星际2rpg地图

13700k c3600 对比5800x3d c3600最低帧只高1帧
如果是13700k超频全P 5.8g,ring 5g 内存4400 c15
最低帧差了10fps

我觉得5800x3d这种U打游戏是真的屌
只是上限不够,因为基本没得超
我朋友找我装电脑一般都是打游戏,暴雪全家桶居多,统统5800x3d

作者: 灵乌路空    时间: 2022-12-6 19:41
(, 下载次数: 49)

https://www.bilibili.com/video/BV16r4y137uz/


看完就懂了




欢迎光临 Chiphell - 分享与交流用户体验 (https://www.chiphell.com/) Powered by Discuz! X3.5