找回密码
 加入我们
搜索
      
查看: 14492|回复: 79

[CPU] 个人理解,目前的消费级PC大小核

[复制链接]
发表于 2024-8-7 17:08 | 显示全部楼层 |阅读模式
本帖最后由 秦南瓜 于 2024-8-7 17:12 编辑

叠甲:
小秦是个pcdiy爱好者,不站队。谁强我买谁。一代版本一代神,玩的时间久了就习惯intel 和 amd强弱交替了。
我不是专业人员,但我会把我作为爱好者以及消费者的视角讲清楚,仅供参考。

我的历史认知:
对于超线程、多核心、大小核,我的认知中,类似的变革经历了很多次,争论也从未停止。
早期奔腾4引入超线程,奔腾d胶水双核,core2 Quad胶水四核,amd真双核/真四核,arm cortex a9同步双核,高通蝎子异步双核,arm 不能同时工作的 biglittle大小核,apple a10 不能同时工作的 biglittle大小核,等等等等。
现在去翻阅一些当年的论战,会找到很多现在看起来搞笑、无厘头的论断。 很有意思。
无非是各家拿钱的水军带带节奏,煽动消费者互喷。赢了不亏,输了有热度,黑红也是红。所以对这些论战见多了。。真麻了。。。


关于ring:
这边提一下ring,环形总线。引用一下这个帖子~~
https://www.vvave.net/archives/t ... h-architecture.html
省流一下,个人关于ring的理解哈:ring在挂在10个核心/模块/簇 以内的效率是较高的。超过10个核心/模块/簇,延迟会明显提高,性能下降也更明显。
(这边引用一下极客湾的图,后面也会多次引用。。。感谢极客湾)
QQ图片20240807163807.png
这也是intel和amd对于多线程性能的追求,走上了两条道路的根本原因。
intel:把ring上挂载的部分大核心替换为小核心簇,提高单模块计算性能,从而提高10个模块限制下整个ring的计算性能。
微信截图_20240807164010.png
AMD:zen1~zen4多ccd,即多ring,每条ring最多挂载8c。zen5也走上了intel的道路,但架构保持相同。
我的观点:PC端大小核的出现,主要是对于多线程性能的追求。intel在那个时间点推出大小核,也是应对amd多ccd策略下超强多线程性能的妥协产物。(还是单die成本太爆炸了

intel大小核
先说下,intel这边12代开始我玩了:12100f、12100、12400f、12490f、12600kf、12700kf、13700kf、14700kf,对我这个跑分党来说,还是挺满意的。。毕竟各项跑分真的不错。
intel 12~14代大小核心的问题(最新的移动端没怎么了解。。我就pass了)
单ring策略,替换大核心为小核簇。且小核心架构与大核心不同。
下面是我的YY部分,实际情况不明哈,我也没去求证,仅供参考~~
12代之前,同构全大核+超线程。任务调度仅需考虑物理核心以及逻辑核心的差异
12代开始,调度任务时,不仅需要根据物理核心以及逻辑核心的差异分配。同时ring上调度分配任务至各模块后,任务分配到小核簇的部分还需要进行二次调度(小核簇共享L2)此时延迟会大幅增加。另外,因大小核架构不同,缓存结构不同,功耗不同。变量太多,调度器按照目前设计的调度逻辑,仍然很容易误判,导致部分应用出现性能问题。
微信截图_20240807164207.png

另外,大家也需要注意到,小核心的算力其实并不低,性能还是不错的。我记得极客湾测出来8个小核心顶个9700k来着。
微信截图_20240807163939.png
但,小核心的缓存配置是极其残废的,这些是小核可以缩小面积的原因之一。
“L1D的大小没有变化,仍为32KB,L2的缓存最高可达4MB,需要注意的是,L2缓存是4个小核一起共用的,同时容量可配置”(如下图)
QQ图片20240807164347.png

想想amd那边5800x3d,7800x3d巨量L3带来的收益,面对高负载应用的情况大缓存肯定是更强的,同理,缓存残废也就意味着出现瓶颈,导致intel小核心本来很棒的算力发挥不出来。

intel个人观点总结:intel的小核心设计,异构、二级调度、小核可用缓存过小,叠的debuff比较多。这也导致跑分很强,实际应用显著不如跑分的情况。intel这几代cpu大部分优势仍然是强大的大核以及超高频率带来的。小核心带来的收益非常非常低。

AMD 多CCD
amd这边从zen1开始,我玩了1700,3500x、3600、3600x、5600x、5600、5800x3d、5900x、7900x、7945hx、7800x3d。目前78x3d大奶服役中~
这块简略一些吧~
直到zen2,L3仍然只能在单CCD中的核心内共享,因此zen2的跨ccd延迟非常高(L3交换)。游戏表现比较糟糕。
zen3,好歹是各CCD间L3共享了,直接实现性能飞跃。但跨CCD延迟仍然较高,这也是7700x游戏性能强于7950x的原因。

amd个人观点总结:基于上面的个人分析,我选择单CCD全大核大缓存的7800x3d作为大奶机cpu,因此首发购入(韭菜)。。当然,时间也在慢慢证明7800x3d的含金量~~

AMD 大小核心
这个我完全没玩,就看了几个评测,所以这块可以更简略一些。。。。
zen5c和zen5是同构的,差异是砍了频率和缓存。相较于intel少了一层异构的debuff。但是!居然跨ccd??
而且大小核心簇对应的L3是分开的,没有共享
同构,但多ccd。我看到这瞬间没兴趣了。。。虽然图形提升还不错。但这代amd大小核的笔记本产品我不会碰的
微信截图_20240807165532.png


最后
消费者的角度,总是希望出现那么一款不计成本,处处想着堆满的产品出现(麒麟9000:?)  
最好它同时还很便宜。哈哈哈,怎么可能。
从企业、商业的角度,这些产品设计注定是充满妥协的,根据设计目标、营销目标、成本限制,条条框框下,做出来的产品肯定是刚刚好,或者差强人意的。

参考手机端大小核发展的历程,从早期大小核心簇来回切换,到现在的三簇、四簇同时调度,也经历了多年的阵痛。
大小核的成熟,这需要时间。

所以现在买啥?我特么为啥要花自己的钱陪着厂商战未来啊??我当然选择全大核!!!!!
 楼主| 发表于 2024-8-7 17:13 | 显示全部楼层
zhuifeng88 发表于 2024-8-7 17:11
"zen3,好歹是各CCD间L3共享了,直接实现性能飞跃。"

这纯属你想多了, zen3只是改成了可以访问, remote脏 ...

所以我只是玩家。仅发表下个人粗浅理解吧
 楼主| 发表于 2024-8-7 17:17 | 显示全部楼层
xy. 发表于 2024-8-7 17:12
先表明立场: 唾弃现在的带英

我觉得吧...

多ccd情有可原吧。不然老玩单die良率过低了。成本妥协的产物。而且实打实的多线程性能提升
 楼主| 发表于 2024-8-7 17:22 | 显示全部楼层
InuYasha 发表于 2024-8-7 17:21
小核应该做成只用来运行操作系统和后台服务,对于普通程序不可见,有特殊需要的程序可以专门申请运行在小核 ...

协处理器的感觉了。也蛮好。
但微软近些年就没给力过
 楼主| 发表于 2024-8-7 17:26 | 显示全部楼层
Illidan2004 发表于 2024-8-7 17:22
“直到zen2,L3仍然只能在单CCD中的核心内共享,因此zen2的跨ccd延迟非常高(L3交换)。游戏表现比较糟糕。 ...

对的,感谢补充。。ccd ccx我没弄清楚。不过大体意思是差不多,反正就是延迟更大。

对于两家产品的接受度。只能说,我没那么强的多线程需求。所以我才选择单CCD的8核心产品。

7950x3d我纠结过买不买,毕竟大缓存那个ccd相较于7800x3d频率稍微高点。
但是要额外装驱动,以及非对称缓存,我看着就浑身难受。。遂放弃
 楼主| 发表于 2024-8-7 17:26 | 显示全部楼层
frezta 发表于 2024-8-7 17:25
不指望AMD的软件优化速度,
立刻把挂黄鱼的8845本子下架重新搭了使用环境

这代大小核apu碰都不想碰。。。
等纯大核吧~
 楼主| 发表于 2024-8-7 17:28 | 显示全部楼层
8owd8wan 发表于 2024-8-7 17:26
类似numa的问题无解,这是物理规律。就好比同一家公司,北京上海成都都有办公室,递送办公用品,总归有邮寄 ...

是这样的,堆cache或者链接速度,都是需要面积的。
成本上第一个直接没希望。
所以现阶段软件没到位的情况下,还是老老实实单ring全大核比较舒适
 楼主| 发表于 2024-8-7 17:35 | 显示全部楼层
8owd8wan 发表于 2024-8-7 17:34
如果是服务器端应用,numa场景真的很常见,我们写的程序,一般都会注意numa亲和性。
比如古早时期mysql, ...

额。我是消费级视角讲的哈哈

多线程刚需的专业领域,这些消费级的小玩意根本不够看
 楼主| 发表于 2024-8-7 17:58 来自手机 | 显示全部楼层
caoyuxin 发表于 2024-8-7 17:49
Mesh架构可以挂更多核,没有跨die问题,就是核心面积一上去,成本太高了点。 ...

当年x299mesh游戏性能实在烂。。消费级还是得ring
 楼主| 发表于 2024-8-7 18:17 来自手机 | 显示全部楼层
8owd8wan 发表于 2024-8-7 17:54
Intel现在的大小核,其实最不负责任的大小核设计。
12/13/14 代为了成本和进度,懒得改Ring,而是在ring ...

设计团队只对kpi负责😂😂
 楼主| 发表于 2024-8-7 18:27 来自手机 | 显示全部楼层
Mashiro_plan_C 发表于 2024-8-7 18:22
APU我看以后不会有纯大核了

没有绝对的事~看看移动soc,旗舰型号一个个都在恢复全大核了
 楼主| 发表于 2024-8-7 18:44 来自手机 | 显示全部楼层
zhuifeng88 发表于 2024-8-7 18:33
大小核改名超大核和大核而已...所谓大核又没比x86两家小核强

arm目前和x86功耗场景不一样这肯定没法比。无论pc还是移动,未来的小核也迟早会比现在的大核强。扯概念是没底的。。
我这么说只是表达没什么绝对的事。
 楼主| 发表于 2024-8-8 00:35 来自手机 | 显示全部楼层
fycmouse 发表于 2024-8-7 23:02
所有的链路接口都用小尺寸缓存,刷新率搞高点?为什么需要统一缓存呢?拆开了按需分配大小不是更节约么? ...

工艺所限,面积小容量就小。频率提高也吃面积。性能库面积大于密度库的原因就是,跑高频需要隔开更远线路距离以避免电磁干扰。
单独任务分配给单个核心会出现空闲核心等待的资源浪费。想要多线程跑单个任务注定需要不同核心读取同一部分缓存,如果缓存不统一,或者说不共享,就会出现a核心通过总线绕到b核心读取b核心专属缓存的情况。延迟++++
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-10-2 07:38 , Processed in 0.011572 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表