个人理解，目前的消费级PC大小核

秦南瓜 · 发表于 2024-8-7 17:08

本帖最后由秦南瓜于 2024-8-7 17:12 编辑

叠甲：
小秦是个pcdiy爱好者，不站队。谁强我买谁。一代版本一代神，玩的时间久了就习惯intel 和 amd强弱交替了。
我不是专业人员，但我会把我作为爱好者以及消费者的视角讲清楚，仅供参考。

我的历史认知：
对于超线程、多核心、大小核，我的认知中，类似的变革经历了很多次，争论也从未停止。
早期奔腾4引入超线程，奔腾d胶水双核，core2 Quad胶水四核，amd真双核/真四核，arm cortex a9同步双核，高通蝎子异步双核，arm 不能同时工作的 biglittle大小核，apple a10 不能同时工作的 biglittle大小核，等等等等。
现在去翻阅一些当年的论战，会找到很多现在看起来搞笑、无厘头的论断。

很有意思。
无非是各家拿钱的水军带带节奏，煽动消费者互喷。赢了不亏，输了有热度，黑红也是红。所以对这些论战见多了。。真麻了。。。

关于ring：
这边提一下ring，环形总线。引用一下这个帖子~~
https://www.vvave.net/archives/t ... h-architecture.html
省流一下，个人关于ring的理解哈：ring在挂在10个核心/模块/簇以内的效率是较高的。超过10个核心/模块/簇，延迟会明显提高，性能下降也更明显。
（这边引用一下极客湾的图，后面也会多次引用。。。感谢极客湾）
QQ图片20240807163807.png

这也是intel和amd对于多线程性能的追求，走上了两条道路的根本原因。
intel：把ring上挂载的部分大核心替换为小核心簇，提高单模块计算性能，从而提高10个模块限制下整个ring的计算性能。
微信截图_20240807164010.png

AMD：zen1~zen4多ccd，即多ring，每条ring最多挂载8c。zen5也走上了intel的道路，但架构保持相同。
我的观点：PC端大小核的出现，主要是对于多线程性能的追求。intel在那个时间点推出大小核，也是应对amd多ccd策略下超强多线程性能的妥协产物。（还是单die成本太爆炸了

）

intel大小核
先说下，intel这边12代开始我玩了：12100f、12100、12400f、12490f、12600kf、12700kf、13700kf、14700kf，对我这个跑分党来说，还是挺满意的。。毕竟各项跑分真的不错。

intel 12~14代大小核心的问题（最新的移动端没怎么了解。。我就pass了）
单ring策略，替换大核心为小核簇。且小核心架构与大核心不同。
下面是我的YY部分，实际情况不明哈，我也没去求证，仅供参考~~
12代之前，同构全大核+超线程。任务调度仅需考虑物理核心以及逻辑核心的差异
12代开始，调度任务时，不仅需要根据物理核心以及逻辑核心的差异分配。同时ring上调度分配任务至各模块后，任务分配到小核簇的部分还需要进行二次调度（小核簇共享L2）此时延迟会大幅增加。另外，因大小核架构不同，缓存结构不同，功耗不同。变量太多，调度器按照目前设计的调度逻辑，仍然很容易误判，导致部分应用出现性能问题。
微信截图_20240807164207.png

另外，大家也需要注意到，小核心的算力其实并不低，性能还是不错的。我记得极客湾测出来8个小核心顶个9700k来着。
微信截图_20240807163939.png

但，小核心的缓存配置是极其残废的，这些是小核可以缩小面积的原因之一。
“L1D的大小没有变化，仍为32KB，L2的缓存最高可达4MB，需要注意的是，L2缓存是4个小核一起共用的，同时容量可配置”（如下图）
QQ图片20240807164347.png

想想amd那边5800x3d，7800x3d巨量L3带来的收益，面对高负载应用的情况大缓存肯定是更强的，同理，缓存残废也就意味着出现瓶颈，导致intel小核心本来很棒的算力发挥不出来。

intel个人观点总结：intel的小核心设计，异构、二级调度、小核可用缓存过小，叠的debuff比较多。这也导致跑分很强，实际应用显著不如跑分的情况。intel这几代cpu大部分优势仍然是强大的大核以及超高频率带来的。小核心带来的收益非常非常低。

AMD 多CCD
amd这边从zen1开始，我玩了1700，3500x、3600、3600x、5600x、5600、5800x3d、5900x、7900x、7945hx、7800x3d。目前78x3d大奶服役中~
这块简略一些吧~
直到zen2，L3仍然只能在单CCD中的核心内共享，因此zen2的跨ccd延迟非常高（L3交换）。游戏表现比较糟糕。
zen3，好歹是各CCD间L3共享了，直接实现性能飞跃。但跨CCD延迟仍然较高，这也是7700x游戏性能强于7950x的原因。

amd个人观点总结：基于上面的个人分析，我选择单CCD全大核大缓存的7800x3d作为大奶机cpu，因此首发购入（韭菜）。。当然，时间也在慢慢证明7800x3d的含金量~~

AMD 大小核心
这个我完全没玩，就看了几个评测，所以这块可以更简略一些。。。。
zen5c和zen5是同构的，差异是砍了频率和缓存。相较于intel少了一层异构的debuff。但是！居然跨ccd？？
而且大小核心簇对应的L3是分开的，没有共享

同构，但多ccd。我看到这瞬间没兴趣了。。。虽然图形提升还不错。但这代amd大小核的笔记本产品我不会碰的

最后
消费者的角度，总是希望出现那么一款不计成本，处处想着堆满的产品出现（麒麟9000：？）
最好它同时还很便宜。哈哈哈，怎么可能。
从企业、商业的角度，这些产品设计注定是充满妥协的，根据设计目标、营销目标、成本限制，条条框框下，做出来的产品肯定是刚刚好，或者差强人意的。

参考手机端大小核发展的历程，从早期大小核心簇来回切换，到现在的三簇、四簇同时调度，也经历了多年的阵痛。
大小核的成熟，这需要时间。

所以现在买啥？我特么为啥要花自己的钱陪着厂商战未来啊？？我当然选择全大核！！！！！

秦南瓜 · 发表于 2024-8-7 17:13

zhuifeng88 发表于 2024-8-7 17:11
"zen3，好歹是各CCD间L3共享了，直接实现性能飞跃。"

这纯属你想多了, zen3只是改成了可以访问, remote脏 ...

所以我只是玩家。仅发表下个人粗浅理解吧

秦南瓜 · 发表于 2024-8-7 17:17

xy. 发表于 2024-8-7 17:12
先表明立场: 唾弃现在的带英

我觉得吧...

多ccd情有可原吧。不然老玩单die良率过低了。成本妥协的产物。而且实打实的多线程性能提升

秦南瓜 · 发表于 2024-8-7 17:22

InuYasha 发表于 2024-8-7 17:21
小核应该做成只用来运行操作系统和后台服务，对于普通程序不可见，有特殊需要的程序可以专门申请运行在小核 ...

协处理器的感觉了。也蛮好。
但微软近些年就没给力过

秦南瓜 · 发表于 2024-8-7 17:26

Illidan2004 发表于 2024-8-7 17:22
“直到zen2，L3仍然只能在单CCD中的核心内共享，因此zen2的跨ccd延迟非常高（L3交换）。游戏表现比较糟糕。 ...

对的，感谢补充。。ccd ccx我没弄清楚。不过大体意思是差不多，反正就是延迟更大。

对于两家产品的接受度。只能说，我没那么强的多线程需求。所以我才选择单CCD的8核心产品。

7950x3d我纠结过买不买，毕竟大缓存那个ccd相较于7800x3d频率稍微高点。
但是要额外装驱动，以及非对称缓存，我看着就浑身难受。。遂放弃

秦南瓜 · 发表于 2024-8-7 17:26

frezta 发表于 2024-8-7 17:25
不指望AMD的软件优化速度,
立刻把挂黄鱼的8845本子下架重新搭了使用环境

这代大小核apu碰都不想碰。。。
等纯大核吧~

秦南瓜 · 发表于 2024-8-7 17:28

8owd8wan 发表于 2024-8-7 17:26
类似numa的问题无解，这是物理规律。就好比同一家公司，北京上海成都都有办公室，递送办公用品，总归有邮寄 ...

是这样的，堆cache或者链接速度，都是需要面积的。
成本上第一个直接没希望。
所以现阶段软件没到位的情况下，还是老老实实单ring全大核比较舒适

秦南瓜 · 发表于 2024-8-7 17:35

8owd8wan 发表于 2024-8-7 17:34
如果是服务器端应用，numa场景真的很常见，我们写的程序，一般都会注意numa亲和性。
比如古早时期mysql， ...

额。我是消费级视角讲的哈哈

多线程刚需的专业领域，这些消费级的小玩意根本不够看

秦南瓜 · 发表于 2024-8-7 17:58

caoyuxin 发表于 2024-8-7 17:49
Mesh架构可以挂更多核，没有跨die问题，就是核心面积一上去，成本太高了点。 ...

当年x299mesh游戏性能实在烂。。消费级还是得ring

秦南瓜 · 发表于 2024-8-7 18:17

8owd8wan 发表于 2024-8-7 17:54
Intel现在的大小核，其实最不负责任的大小核设计。
12/13/14 代为了成本和进度，懒得改Ring，而是在ring ...

设计团队只对kpi负责😂😂

秦南瓜 · 发表于 2024-8-7 18:27

Mashiro_plan_C 发表于 2024-8-7 18:22
APU我看以后不会有纯大核了

没有绝对的事~看看移动soc，旗舰型号一个个都在恢复全大核了

秦南瓜 · 发表于 2024-8-7 18:44

zhuifeng88 发表于 2024-8-7 18:33
大小核改名超大核和大核而已...所谓大核又没比x86两家小核强

arm目前和x86功耗场景不一样这肯定没法比。无论pc还是移动，未来的小核也迟早会比现在的大核强。扯概念是没底的。。
我这么说只是表达没什么绝对的事。

秦南瓜 · 发表于 2024-8-8 00:35

fycmouse 发表于 2024-8-7 23:02
所有的链路接口都用小尺寸缓存，刷新率搞高点？为什么需要统一缓存呢？拆开了按需分配大小不是更节约么？ ...

工艺所限，面积小容量就小。频率提高也吃面积。性能库面积大于密度库的原因就是，跑高频需要隔开更远线路距离以避免电磁干扰。
单独任务分配给单个核心会出现空闲核心等待的资源浪费。想要多线程跑单个任务注定需要不同核心读取同一部分缓存，如果缓存不统一，或者说不共享，就会出现a核心通过总线绕到b核心读取b核心专属缓存的情况。延迟++++

账号		自动登录	找回密码
密码			加入我们

[CPU] 个人理解，目前的消费级PC大小核

浏览过的版块