找回密码
 加入我们
搜索
      
查看: 14697|回复: 79

[CPU] 个人理解,目前的消费级PC大小核

[复制链接]
发表于 2024-8-7 17:08 | 显示全部楼层 |阅读模式
本帖最后由 秦南瓜 于 2024-8-7 17:12 编辑

叠甲:
小秦是个pcdiy爱好者,不站队。谁强我买谁。一代版本一代神,玩的时间久了就习惯intel 和 amd强弱交替了。
我不是专业人员,但我会把我作为爱好者以及消费者的视角讲清楚,仅供参考。

我的历史认知:
对于超线程、多核心、大小核,我的认知中,类似的变革经历了很多次,争论也从未停止。
早期奔腾4引入超线程,奔腾d胶水双核,core2 Quad胶水四核,amd真双核/真四核,arm cortex a9同步双核,高通蝎子异步双核,arm 不能同时工作的 biglittle大小核,apple a10 不能同时工作的 biglittle大小核,等等等等。
现在去翻阅一些当年的论战,会找到很多现在看起来搞笑、无厘头的论断。 很有意思。
无非是各家拿钱的水军带带节奏,煽动消费者互喷。赢了不亏,输了有热度,黑红也是红。所以对这些论战见多了。。真麻了。。。


关于ring:
这边提一下ring,环形总线。引用一下这个帖子~~
https://www.vvave.net/archives/t ... h-architecture.html
省流一下,个人关于ring的理解哈:ring在挂在10个核心/模块/簇 以内的效率是较高的。超过10个核心/模块/簇,延迟会明显提高,性能下降也更明显。
(这边引用一下极客湾的图,后面也会多次引用。。。感谢极客湾)
QQ图片20240807163807.png
这也是intel和amd对于多线程性能的追求,走上了两条道路的根本原因。
intel:把ring上挂载的部分大核心替换为小核心簇,提高单模块计算性能,从而提高10个模块限制下整个ring的计算性能。
微信截图_20240807164010.png
AMD:zen1~zen4多ccd,即多ring,每条ring最多挂载8c。zen5也走上了intel的道路,但架构保持相同。
我的观点:PC端大小核的出现,主要是对于多线程性能的追求。intel在那个时间点推出大小核,也是应对amd多ccd策略下超强多线程性能的妥协产物。(还是单die成本太爆炸了

intel大小核
先说下,intel这边12代开始我玩了:12100f、12100、12400f、12490f、12600kf、12700kf、13700kf、14700kf,对我这个跑分党来说,还是挺满意的。。毕竟各项跑分真的不错。
intel 12~14代大小核心的问题(最新的移动端没怎么了解。。我就pass了)
单ring策略,替换大核心为小核簇。且小核心架构与大核心不同。
下面是我的YY部分,实际情况不明哈,我也没去求证,仅供参考~~
12代之前,同构全大核+超线程。任务调度仅需考虑物理核心以及逻辑核心的差异
12代开始,调度任务时,不仅需要根据物理核心以及逻辑核心的差异分配。同时ring上调度分配任务至各模块后,任务分配到小核簇的部分还需要进行二次调度(小核簇共享L2)此时延迟会大幅增加。另外,因大小核架构不同,缓存结构不同,功耗不同。变量太多,调度器按照目前设计的调度逻辑,仍然很容易误判,导致部分应用出现性能问题。
微信截图_20240807164207.png

另外,大家也需要注意到,小核心的算力其实并不低,性能还是不错的。我记得极客湾测出来8个小核心顶个9700k来着。
微信截图_20240807163939.png
但,小核心的缓存配置是极其残废的,这些是小核可以缩小面积的原因之一。
“L1D的大小没有变化,仍为32KB,L2的缓存最高可达4MB,需要注意的是,L2缓存是4个小核一起共用的,同时容量可配置”(如下图)
QQ图片20240807164347.png

想想amd那边5800x3d,7800x3d巨量L3带来的收益,面对高负载应用的情况大缓存肯定是更强的,同理,缓存残废也就意味着出现瓶颈,导致intel小核心本来很棒的算力发挥不出来。

intel个人观点总结:intel的小核心设计,异构、二级调度、小核可用缓存过小,叠的debuff比较多。这也导致跑分很强,实际应用显著不如跑分的情况。intel这几代cpu大部分优势仍然是强大的大核以及超高频率带来的。小核心带来的收益非常非常低。

AMD 多CCD
amd这边从zen1开始,我玩了1700,3500x、3600、3600x、5600x、5600、5800x3d、5900x、7900x、7945hx、7800x3d。目前78x3d大奶服役中~
这块简略一些吧~
直到zen2,L3仍然只能在单CCD中的核心内共享,因此zen2的跨ccd延迟非常高(L3交换)。游戏表现比较糟糕。
zen3,好歹是各CCD间L3共享了,直接实现性能飞跃。但跨CCD延迟仍然较高,这也是7700x游戏性能强于7950x的原因。

amd个人观点总结:基于上面的个人分析,我选择单CCD全大核大缓存的7800x3d作为大奶机cpu,因此首发购入(韭菜)。。当然,时间也在慢慢证明7800x3d的含金量~~

AMD 大小核心
这个我完全没玩,就看了几个评测,所以这块可以更简略一些。。。。
zen5c和zen5是同构的,差异是砍了频率和缓存。相较于intel少了一层异构的debuff。但是!居然跨ccd??
而且大小核心簇对应的L3是分开的,没有共享
同构,但多ccd。我看到这瞬间没兴趣了。。。虽然图形提升还不错。但这代amd大小核的笔记本产品我不会碰的
微信截图_20240807165532.png


最后
消费者的角度,总是希望出现那么一款不计成本,处处想着堆满的产品出现(麒麟9000:?)  
最好它同时还很便宜。哈哈哈,怎么可能。
从企业、商业的角度,这些产品设计注定是充满妥协的,根据设计目标、营销目标、成本限制,条条框框下,做出来的产品肯定是刚刚好,或者差强人意的。

参考手机端大小核发展的历程,从早期大小核心簇来回切换,到现在的三簇、四簇同时调度,也经历了多年的阵痛。
大小核的成熟,这需要时间。

所以现在买啥?我特么为啥要花自己的钱陪着厂商战未来啊??我当然选择全大核!!!!!
发表于 2024-8-11 18:30 | 显示全部楼层
zhuifeng88 发表于 2024-8-8 12:21
那单纯是amd全核降频比较少, 都默认功耗墙下, 9654单核3.7全核cpuz类似负载可以3.4, 3475x单核4.8全核类 ...

降频一部分原因,按效率算,mesh总线也比不过IF总线
发表于 2024-8-11 18:21 来自手机 | 显示全部楼层
605229105 发表于 2024-8-11 18:08
市场不买账的话,最多头铁两代,之后再我行我素不出全大核难道等着股票爆炸? ...

一是AMD业务重心不在PC真影响不了什么,英特尔股价爆炸也不是因为13/14代质量问题,二是移动端正需要这种能效比表现优秀的设计,要高性能就把桌面端搬过去,至于桌面端APU就没什么人买
发表于 2024-8-11 18:08 | 显示全部楼层
Mashiro_plan_C 发表于 2024-8-7 18:22
APU我看以后不会有纯大核了

市场不买账的话,最多头铁两代,之后再我行我素不出全大核难道等着股票爆炸?
发表于 2024-8-11 17:19 | 显示全部楼层
8owd8wan 发表于 2024-8-7 17:54
Intel现在的大小核,其实最不负责任的大小核设计。
12/13/14 代为了成本和进度,懒得改Ring,而是在ring ...

讲的真不错啊。
发表于 2024-8-9 00:24 | 显示全部楼层
用户体验的是特定设计的分类场景的产品,人话,通过削足适履的结果反推设计的合理性,这个逻辑,嘿嘿。
另外极客湾也就是产品体验用户端民科水平,切不可奉若圭臬,自己掉坑浑然不知。
发表于 2024-8-8 23:12 | 显示全部楼层
你根本没讲到关键

zen2到zen3的游戏进步来自于不再跨ccx了,zen2的一个ccd是两个ccx4+4的组合
发表于 2024-8-8 16:29 | 显示全部楼层
FelixIvory 发表于 2024-8-7 19:40
还不是amd抠,拿桌面端糊弄,那个待机续航根本是不合格的笔记本产品。

而且大小核除了涨价,其实意义不 ...

趁对手不给力 实验点新东西不行吗?
技术进步总要有中间试错的  INTEL搞了那么久你不搞万一哪天真不行了呢
太稳当说不定是容易突然落后翻车的
发表于 2024-8-8 15:29 来自手机 | 显示全部楼层
xy. 发表于 2024-8-8 09:34
这种就是标准的 hedt 目标用户啊. 臭打游戏的用 msdt, 干活的用 hedt 不是挺好么

zen2 和 x399 以及后续 ...

hedt用户表示现在的大小核i9太香了 完美匹配我的需求 比曾经的x299提高太多。
发表于 2024-8-8 12:21 | 显示全部楼层
赫敏 发表于 2024-8-8 09:43
36大核才赢了不到一倍算惨胜吧。。。。amd那边基本线性提升


那单纯是amd全核降频比较少, 都默认功耗墙下, 9654单核3.7全核cpuz类似负载可以3.4, 3475x单核4.8全核类似负载只能3.3-3.5
发表于 2024-8-8 12:16 来自手机 | 显示全部楼层
赫敏 发表于 2024-8-8 09:43
36大核才赢了不到一倍算惨胜吧。。。。amd那边基本线性提升

不是纯线性的,大小核小核有能效优势,24核就能有一半性能也不错。3475x虽然都是大核全核满载频率2.2G,这性能也正常。
发表于 2024-8-8 11:37 | 显示全部楼层
我等成熟了再买
发表于 2024-8-8 11:26 | 显示全部楼层
妥协=妥善+协调。
大小核,何尝不是妥协的产物。
差不多就好。
发表于 2024-8-8 09:43 | 显示全部楼层
caoyuxin 发表于 2024-8-7 20:38
看了下3475X  跑CPU-Z 单核800+ 多核33W还行啊。。。

36大核才赢了不到一倍算惨胜吧。。。。amd那边基本线性提升
发表于 2024-8-8 09:38 | 显示全部楼层
赫敏 发表于 2024-8-8 09:14
问题是mesh的纯24大核w2400多核也没打过13900k,单核更是惨不忍睹,功耗还高

看了下3475X  跑CPU-Z 单核800+ 多核33W还行啊。。。
发表于 2024-8-8 09:34 | 显示全部楼层
houyuzhou 发表于 2024-8-8 09:24
那你的意思是MSDT就不配拥有更强的多核心性能被

我挺需要这种U的,干活能保证交互的实时度流畅度,渲染 ...


这种就是标准的 hedt 目标用户啊. 臭打游戏的用 msdt, 干活的用 hedt 不是挺好么

zen2 和 x399 以及后续的一系列操作把 hedt 直接干死了. 普通用户用不上, 而且体验倒退. 生产力用户又不够用. 搞 ws 白白多花钱.


当然我知道 hedt 必须死, 因为人家就没正眼看过消费级用户
发表于 2024-8-8 09:24 | 显示全部楼层
xy. 发表于 2024-8-7 17:12
先表明立场: 唾弃现在的带英

我觉得吧...

那你的意思是MSDT就不配拥有更强的多核心性能被

我挺需要这种U的,干活能保证交互的实时度流畅度,渲染输出又可以有一定的全核性能。
发表于 2024-8-8 09:21 | 显示全部楼层
8owd8wan 发表于 2024-8-7 04:28
设想个极端情况,单die,4096核,一片晶圆,那么良品率无限趋近于0,哈哈哈 ...

已经有人这样做了,不过是单晶圆400000核
发表于 2024-8-8 09:14 | 显示全部楼层
caoyuxin 发表于 2024-8-7 04:49
Mesh架构可以挂更多核,没有跨die问题,就是核心面积一上去,成本太高了点。 ...

问题是mesh的纯24大核w2400多核也没打过13900k,单核更是惨不忍睹,功耗还高
发表于 2024-8-8 00:40 来自手机 | 显示全部楼层
alieshex 发表于 2024-8-7 19:42
不要拿捡垃圾的价格来比
intel ark E5-2699 v3  $4115.00
自己算算啥价格

论捡垃圾的价格,最近好像看到SPR 56核卖1500刀还送个主板,比2696v3也不遑多让。

cpu缓存不够也不算啥了,gpu连显存都不够,还得去硬盘读数据。
 楼主| 发表于 2024-8-8 00:35 来自手机 | 显示全部楼层
fycmouse 发表于 2024-8-7 23:02
所有的链路接口都用小尺寸缓存,刷新率搞高点?为什么需要统一缓存呢?拆开了按需分配大小不是更节约么? ...

工艺所限,面积小容量就小。频率提高也吃面积。性能库面积大于密度库的原因就是,跑高频需要隔开更远线路距离以避免电磁干扰。
单独任务分配给单个核心会出现空闲核心等待的资源浪费。想要多线程跑单个任务注定需要不同核心读取同一部分缓存,如果缓存不统一,或者说不共享,就会出现a核心通过总线绕到b核心读取b核心专属缓存的情况。延迟++++
发表于 2024-8-7 23:18 来自手机 | 显示全部楼层
zhuifeng88 发表于 2024-8-7 21:28
8c以上强不了...你大可以试试3435x在不面临内存带宽瓶颈或者pcie侧io瓶颈的情况下比139弱多少

24c以上才 ...

mesh 大规模堆核不方便,而且会因为工艺良品率而困扰
发表于 2024-8-7 23:02 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
发表于 2024-8-7 22:10 | 显示全部楼层
8owd8wan 发表于 2024-8-7 17:28
设想个极端情况,单die,4096核,一片晶圆,那么良品率无限趋近于0,哈哈哈 ...

不见得,支持灵活屏蔽即可。比如说片上8192核,但是实际上只用4096个,多的用于冗余,这样良品率无限趋近于100%。当然实际生产过程中defect会越来越少,那么就后面出+ ++ ++++各个更高档的型号。
发表于 2024-8-7 22:08 来自手机 | 显示全部楼层
zhuifeng88 发表于 2024-8-7 21:28
8c以上强不了...你大可以试试3435x在不面临内存带宽瓶颈或者pcie侧io瓶颈的情况下比139弱多少

24c以上才 ...

好像是你算得的对。。。
发表于 2024-8-7 21:28 | 显示全部楼层
caoyuxin 发表于 2024-8-7 21:20
8C以上比ring强了,整体要比比dual ring有优势,24C以上等大船靠港就买的起了。 ...


8c以上强不了...你大可以试试3435x在不面临内存带宽瓶颈或者pcie侧io瓶颈的情况下比139弱多少

24c以上才行

mesh只把16c最远长度降低到6眺(实际上是7跳, 内存控制器等也占站点), 但是代价是频率只有2.5ghz, 超冒烟都只能2.7ghz
139的大单ring虽然最远是9跳, 但是频率随便就能5ghz以上,  延迟仍然更低
发表于 2024-8-7 21:20 来自手机 | 显示全部楼层
5d5588cf 发表于 2024-8-7 20:48
整体再怎么低也没用。8c以内打不过ring,超过8c的应用也不见得比dual ring强多少,渲染类的更是没差。真 ...

8C以上比ring强了,整体要比比dual ring有优势,24C以上等大船靠港就买的起了。
发表于 2024-8-7 21:14 | 显示全部楼层
其实Ring总线的话最多挂10个Node是单向Ring,如果愿意花成本的话可以用双向Ring可以挂更多的核心同时延时更低
发表于 2024-8-7 20:54 | 显示全部楼层
坐等AMD祭出8P+16E
发表于 2024-8-7 20:48 | 显示全部楼层
caoyuxin 发表于 2024-8-7 20:33
频率是低了点,不过路多了,整体距离近了,延迟低了。

整体再怎么低也没用。8c以内打不过ring,超过8c的应用也不见得比dual ring强多少,渲染类的更是没差。真正能体现mesh优势的场景是24c以上的hpc application,但一般人买不起,也用不到。
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-10-15 06:20 , Processed in 0.015422 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表