个人理解，目前的消费级PC大小核

秦南瓜 · 发表于 2024-8-7 17:08

本帖最后由秦南瓜于 2024-8-7 17:12 编辑

叠甲：
小秦是个pcdiy爱好者，不站队。谁强我买谁。一代版本一代神，玩的时间久了就习惯intel 和 amd强弱交替了。
我不是专业人员，但我会把我作为爱好者以及消费者的视角讲清楚，仅供参考。

我的历史认知：
对于超线程、多核心、大小核，我的认知中，类似的变革经历了很多次，争论也从未停止。
早期奔腾4引入超线程，奔腾d胶水双核，core2 Quad胶水四核，amd真双核/真四核，arm cortex a9同步双核，高通蝎子异步双核，arm 不能同时工作的 biglittle大小核，apple a10 不能同时工作的 biglittle大小核，等等等等。
现在去翻阅一些当年的论战，会找到很多现在看起来搞笑、无厘头的论断。

很有意思。
无非是各家拿钱的水军带带节奏，煽动消费者互喷。赢了不亏，输了有热度，黑红也是红。所以对这些论战见多了。。真麻了。。。

关于ring：
这边提一下ring，环形总线。引用一下这个帖子~~
https://www.vvave.net/archives/t ... h-architecture.html
省流一下，个人关于ring的理解哈：ring在挂在10个核心/模块/簇以内的效率是较高的。超过10个核心/模块/簇，延迟会明显提高，性能下降也更明显。
（这边引用一下极客湾的图，后面也会多次引用。。。感谢极客湾）
QQ图片20240807163807.png

这也是intel和amd对于多线程性能的追求，走上了两条道路的根本原因。
intel：把ring上挂载的部分大核心替换为小核心簇，提高单模块计算性能，从而提高10个模块限制下整个ring的计算性能。
微信截图_20240807164010.png

AMD：zen1~zen4多ccd，即多ring，每条ring最多挂载8c。zen5也走上了intel的道路，但架构保持相同。
我的观点：PC端大小核的出现，主要是对于多线程性能的追求。intel在那个时间点推出大小核，也是应对amd多ccd策略下超强多线程性能的妥协产物。（还是单die成本太爆炸了

）

intel大小核
先说下，intel这边12代开始我玩了：12100f、12100、12400f、12490f、12600kf、12700kf、13700kf、14700kf，对我这个跑分党来说，还是挺满意的。。毕竟各项跑分真的不错。

intel 12~14代大小核心的问题（最新的移动端没怎么了解。。我就pass了）
单ring策略，替换大核心为小核簇。且小核心架构与大核心不同。
下面是我的YY部分，实际情况不明哈，我也没去求证，仅供参考~~
12代之前，同构全大核+超线程。任务调度仅需考虑物理核心以及逻辑核心的差异
12代开始，调度任务时，不仅需要根据物理核心以及逻辑核心的差异分配。同时ring上调度分配任务至各模块后，任务分配到小核簇的部分还需要进行二次调度（小核簇共享L2）此时延迟会大幅增加。另外，因大小核架构不同，缓存结构不同，功耗不同。变量太多，调度器按照目前设计的调度逻辑，仍然很容易误判，导致部分应用出现性能问题。
微信截图_20240807164207.png

另外，大家也需要注意到，小核心的算力其实并不低，性能还是不错的。我记得极客湾测出来8个小核心顶个9700k来着。
微信截图_20240807163939.png

但，小核心的缓存配置是极其残废的，这些是小核可以缩小面积的原因之一。
“L1D的大小没有变化，仍为32KB，L2的缓存最高可达4MB，需要注意的是，L2缓存是4个小核一起共用的，同时容量可配置”（如下图）
QQ图片20240807164347.png

想想amd那边5800x3d，7800x3d巨量L3带来的收益，面对高负载应用的情况大缓存肯定是更强的，同理，缓存残废也就意味着出现瓶颈，导致intel小核心本来很棒的算力发挥不出来。

intel个人观点总结：intel的小核心设计，异构、二级调度、小核可用缓存过小，叠的debuff比较多。这也导致跑分很强，实际应用显著不如跑分的情况。intel这几代cpu大部分优势仍然是强大的大核以及超高频率带来的。小核心带来的收益非常非常低。

AMD 多CCD
amd这边从zen1开始，我玩了1700，3500x、3600、3600x、5600x、5600、5800x3d、5900x、7900x、7945hx、7800x3d。目前78x3d大奶服役中~
这块简略一些吧~
直到zen2，L3仍然只能在单CCD中的核心内共享，因此zen2的跨ccd延迟非常高（L3交换）。游戏表现比较糟糕。
zen3，好歹是各CCD间L3共享了，直接实现性能飞跃。但跨CCD延迟仍然较高，这也是7700x游戏性能强于7950x的原因。

amd个人观点总结：基于上面的个人分析，我选择单CCD全大核大缓存的7800x3d作为大奶机cpu，因此首发购入（韭菜）。。当然，时间也在慢慢证明7800x3d的含金量~~

AMD 大小核心
这个我完全没玩，就看了几个评测，所以这块可以更简略一些。。。。
zen5c和zen5是同构的，差异是砍了频率和缓存。相较于intel少了一层异构的debuff。但是！居然跨ccd？？
而且大小核心簇对应的L3是分开的，没有共享

同构，但多ccd。我看到这瞬间没兴趣了。。。虽然图形提升还不错。但这代amd大小核的笔记本产品我不会碰的

最后
消费者的角度，总是希望出现那么一款不计成本，处处想着堆满的产品出现（麒麟9000：？）
最好它同时还很便宜。哈哈哈，怎么可能。
从企业、商业的角度，这些产品设计注定是充满妥协的，根据设计目标、营销目标、成本限制，条条框框下，做出来的产品肯定是刚刚好，或者差强人意的。

参考手机端大小核发展的历程，从早期大小核心簇来回切换，到现在的三簇、四簇同时调度，也经历了多年的阵痛。
大小核的成熟，这需要时间。

所以现在买啥？我特么为啥要花自己的钱陪着厂商战未来啊？？我当然选择全大核！！！！！

gihu · 发表于 2024-8-11 18:30

zhuifeng88 发表于 2024-8-8 12:21
那单纯是amd全核降频比较少, 都默认功耗墙下, 9654单核3.7全核cpuz类似负载可以3.4, 3475x单核4.8全核类 ...

降频一部分原因，按效率算，mesh总线也比不过IF总线

Mashiro_plan_C · 发表于 2024-8-11 18:21

605229105 发表于 2024-8-11 18:08
市场不买账的话，最多头铁两代，之后再我行我素不出全大核难道等着股票爆炸？ ...

一是AMD业务重心不在PC真影响不了什么，英特尔股价爆炸也不是因为13/14代质量问题，二是移动端正需要这种能效比表现优秀的设计，要高性能就把桌面端搬过去，至于桌面端APU就没什么人买

605229105 · 发表于 2024-8-11 18:08

Mashiro_plan_C 发表于 2024-8-7 18:22
APU我看以后不会有纯大核了

市场不买账的话，最多头铁两代，之后再我行我素不出全大核难道等着股票爆炸？

2710 · 发表于 2024-8-11 17:19

8owd8wan 发表于 2024-8-7 17:54
Intel现在的大小核，其实最不负责任的大小核设计。
12/13/14 代为了成本和进度，懒得改Ring，而是在ring ...

讲的真不错啊。

zerozerone · 发表于 2024-8-9 00:24

用户体验的是特定设计的分类场景的产品，人话，通过削足适履的结果反推设计的合理性，这个逻辑，嘿嘿。
另外极客湾也就是产品体验用户端民科水平，切不可奉若圭臬，自己掉坑浑然不知。

ghgfhghj · 发表于 2024-8-8 23:12

你根本没讲到关键

zen2到zen3的游戏进步来自于不再跨ccx了，zen2的一个ccd是两个ccx4+4的组合

Illidan2004 · 发表于 2024-8-8 16:29

FelixIvory 发表于 2024-8-7 19:40
还不是amd抠，拿桌面端糊弄，那个待机续航根本是不合格的笔记本产品。

而且大小核除了涨价，其实意义不 ...

趁对手不给力实验点新东西不行吗？
技术进步总要有中间试错的 INTEL搞了那么久你不搞万一哪天真不行了呢
太稳当说不定是容易突然落后翻车的

houyuzhou · 发表于 2024-8-8 15:29

xy. 发表于 2024-8-8 09:34
这种就是标准的 hedt 目标用户啊. 臭打游戏的用 msdt, 干活的用 hedt 不是挺好么

zen2 和 x399 以及后续 ...

hedt用户表示现在的大小核i9太香了完美匹配我的需求比曾经的x299提高太多。

zhuifeng88 · 发表于 2024-8-8 12:21

赫敏发表于 2024-8-8 09:43
36大核才赢了不到一倍算惨胜吧。。。。amd那边基本线性提升

那单纯是amd全核降频比较少, 都默认功耗墙下, 9654单核3.7全核cpuz类似负载可以3.4, 3475x单核4.8全核类似负载只能3.3-3.5

caoyuxin · 发表于 2024-8-8 12:16

赫敏发表于 2024-8-8 09:43
36大核才赢了不到一倍算惨胜吧。。。。amd那边基本线性提升

不是纯线性的，大小核小核有能效优势，24核就能有一半性能也不错。3475x虽然都是大核全核满载频率2.2G，这性能也正常。

tangyu147 · 发表于 2024-8-8 11:37

我等成熟了再买

mhsk · 发表于 2024-8-8 11:26

妥协=妥善+协调。
大小核，何尝不是妥协的产物。
差不多就好。

赫敏 · 发表于 2024-8-8 09:43

caoyuxin 发表于 2024-8-7 20:38
看了下3475X 跑CPU-Z 单核800+ 多核33W还行啊。。。

36大核才赢了不到一倍算惨胜吧。。。。amd那边基本线性提升

caoyuxin · 发表于 2024-8-8 09:38

赫敏发表于 2024-8-8 09:14
问题是mesh的纯24大核w2400多核也没打过13900k，单核更是惨不忍睹，功耗还高

看了下3475X 跑CPU-Z 单核800+ 多核33W还行啊。。。

xy. · 发表于 2024-8-8 09:34

houyuzhou 发表于 2024-8-8 09:24
那你的意思是MSDT就不配拥有更强的多核心性能被

我挺需要这种U的，干活能保证交互的实时度流畅度，渲染 ...

这种就是标准的 hedt 目标用户啊. 臭打游戏的用 msdt, 干活的用 hedt 不是挺好么

zen2 和 x399 以及后续的一系列操作把 hedt 直接干死了. 普通用户用不上, 而且体验倒退. 生产力用户又不够用. 搞 ws 白白多花钱.

当然我知道 hedt 必须死, 因为人家就没正眼看过消费级用户

houyuzhou · 发表于 2024-8-8 09:24

xy. 发表于 2024-8-7 17:12
先表明立场: 唾弃现在的带英

我觉得吧...

那你的意思是MSDT就不配拥有更强的多核心性能被

我挺需要这种U的，干活能保证交互的实时度流畅度，渲染输出又可以有一定的全核性能。

赫敏 · 发表于 2024-8-8 09:21

8owd8wan 发表于 2024-8-7 04:28
设想个极端情况，单die，4096核，一片晶圆，那么良品率无限趋近于0，哈哈哈 ...

已经有人这样做了，不过是单晶圆400000核

赫敏 · 发表于 2024-8-8 09:14

caoyuxin 发表于 2024-8-7 04:49
Mesh架构可以挂更多核，没有跨die问题，就是核心面积一上去，成本太高了点。 ...

问题是mesh的纯24大核w2400多核也没打过13900k，单核更是惨不忍睹，功耗还高

用户 · 发表于 2024-8-8 00:40

alieshex 发表于 2024-8-7 19:42
不要拿捡垃圾的价格来比
intel ark E5-2699 v3 $4115.00
自己算算啥价格

论捡垃圾的价格，最近好像看到SPR 56核卖1500刀还送个主板，比2696v3也不遑多让。

cpu缓存不够也不算啥了，gpu连显存都不够，还得去硬盘读数据。

秦南瓜 · 发表于 2024-8-8 00:35

fycmouse 发表于 2024-8-7 23:02
所有的链路接口都用小尺寸缓存，刷新率搞高点？为什么需要统一缓存呢？拆开了按需分配大小不是更节约么？ ...

工艺所限，面积小容量就小。频率提高也吃面积。性能库面积大于密度库的原因就是，跑高频需要隔开更远线路距离以避免电磁干扰。
单独任务分配给单个核心会出现空闲核心等待的资源浪费。想要多线程跑单个任务注定需要不同核心读取同一部分缓存，如果缓存不统一，或者说不共享，就会出现a核心通过总线绕到b核心读取b核心专属缓存的情况。延迟++++

8owd8wan · 发表于 2024-8-7 23:18

zhuifeng88 发表于 2024-8-7 21:28
8c以上强不了...你大可以试试3435x在不面临内存带宽瓶颈或者pcie侧io瓶颈的情况下比139弱多少

24c以上才 ...

mesh 大规模堆核不方便，而且会因为工艺良品率而困扰

fycmouse · 发表于 2024-8-7 23:02

提示: 作者被禁止或删除内容自动屏蔽

besttime · 发表于 2024-8-7 22:10

8owd8wan 发表于 2024-8-7 17:28
设想个极端情况，单die，4096核，一片晶圆，那么良品率无限趋近于0，哈哈哈 ...

不见得，支持灵活屏蔽即可。比如说片上8192核，但是实际上只用4096个，多的用于冗余，这样良品率无限趋近于100%。当然实际生产过程中defect会越来越少，那么就后面出+ ++ ++++各个更高档的型号。

caoyuxin · 发表于 2024-8-7 22:08

zhuifeng88 发表于 2024-8-7 21:28
8c以上强不了...你大可以试试3435x在不面临内存带宽瓶颈或者pcie侧io瓶颈的情况下比139弱多少

24c以上才 ...

好像是你算得的对。。。

zhuifeng88 · 发表于 2024-8-7 21:28

caoyuxin 发表于 2024-8-7 21:20
8C以上比ring强了，整体要比比dual ring有优势，24C以上等大船靠港就买的起了。 ...

8c以上强不了...你大可以试试3435x在不面临内存带宽瓶颈或者pcie侧io瓶颈的情况下比139弱多少

24c以上才行

mesh只把16c最远长度降低到6眺(实际上是7跳, 内存控制器等也占站点), 但是代价是频率只有2.5ghz, 超冒烟都只能2.7ghz
139的大单ring虽然最远是9跳, 但是频率随便就能5ghz以上, 延迟仍然更低

caoyuxin · 发表于 2024-8-7 21:20

5d5588cf 发表于 2024-8-7 20:48
整体再怎么低也没用。8c以内打不过ring，超过8c的应用也不见得比dual ring强多少，渲染类的更是没差。真 ...

8C以上比ring强了，整体要比比dual ring有优势，24C以上等大船靠港就买的起了。

Junh@wk · 发表于 2024-8-7 21:14

其实Ring总线的话最多挂10个Node是单向Ring，如果愿意花成本的话可以用双向Ring可以挂更多的核心同时延时更低

tudou02 · 发表于 2024-8-7 20:54

坐等AMD祭出8P+16E

5d5588cf · 发表于 2024-8-7 20:48

caoyuxin 发表于 2024-8-7 20:33
频率是低了点，不过路多了，整体距离近了，延迟低了。

整体再怎么低也没用。8c以内打不过ring，超过8c的应用也不见得比dual ring强多少，渲染类的更是没差。真正能体现mesh优势的场景是24c以上的hpc application，但一般人买不起，也用不到。

账号		自动登录	找回密码
密码			加入我们

fycmouse fycmouse 当前离线积分 3558	发表于 2024-8-7 23:02 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽
fycmouse fycmouse 当前离线积分 3558
	回复举报

[CPU] 个人理解，目前的消费级PC大小核

浏览过的版块