找回密码
 加入我们
搜索
      
查看: 4680|回复: 49

[CPU] 没有所谓的同构大小核比异构大小核好的这种说法

[复制链接]
发表于 2024-8-8 16:13 | 显示全部楼层 |阅读模式
不知道这种概念是谁先提出来的,纯属扯淡,类似的说法还有什么“AMD是高密度核和低密度核,不是大小核”之类的

1、首先,只要核心里面有快和慢两种核心,那就是大小核
2、对于操作系统的Dispatcher(分派器)来说,根本不会感知下面的CPU核心架构是一样还是不一样,只有快和慢两种
3、对于CPU自己的Dispatcher来说,会更加细分的基于具体指令快慢来进行分派,但是这也跟架构无关,具体指标是“执行速度”和具体的context

所谓同构大小核比异构大小核好,那是因为同构的核心一般性能更加接近,在错误分派的时候,体验gap没有那么大。这个问题出在调度而非小核心本身的架构。
如果一个处理器大核心和小核心架构天差地别,但是性能十分接近,那会比你同构大小核心但是性能差距很大感受更好。

重点在于大小核心的性能gap,而不是架构

点评

就你这水平有什么必要特地买个号过来找不自在呢,还是说开个小号在串?  发表于 2024-8-8 16:57
发表于 2024-8-8 16:25 | 显示全部楼层
那又怎么样呢,现在intel那破烂异构大小核就是拉啊
发表于 2024-8-8 16:33 | 显示全部楼层
处理器指令吞吐指令延迟情况不一样,编译优化也不一样。
同一段功能,在两个兼容处理器上理论最佳的二进制可执行程序是不同的。
发表于 2024-8-8 16:38 | 显示全部楼层
本帖最后由 alieshex 于 2024-8-8 16:58 编辑

但是intel出现了avx能跑和不能跑的核,这是分配错了直接挂的

我同意确实没有谁比谁好
但前提是你至少做到像手机soc那样的调度,而不是现在win这种残废的调度
发表于 2024-8-8 16:40 来自手机 | 显示全部楼层
编译器调参不一样,性能会不一样。小核上跑得最快的编译参数,在大核上跑,性能很可能不如默认参数
发表于 2024-8-8 16:51 | 显示全部楼层
intel四个小核一个簇,共享同一个ring bus出口,2级缓存又小,存在资源抢夺。
纵使你的工厂有一万条流水线,但是仓库只有半平,出入口仅限一米宽,原料进出困难,再高的性能也会浪费在无尽的等待中。
 楼主| 发表于 2024-8-8 16:55 | 显示全部楼层
af_x_if 发表于 2024-8-8 16:33
处理器指令吞吐指令延迟情况不一样,编译优化也不一样。
同一段功能,在两个兼容处理器上理论最佳的二进制 ...

你在Intel cpu上面编译的程序,在AMD的cpu上也跑不到最佳能效
本来就是要找一个折中值
 楼主| 发表于 2024-8-8 16:56 | 显示全部楼层
rx_78gp02a 发表于 2024-8-8 16:51
intel四个小核一个簇,共享同一个ring bus出口,2级缓存又小,存在资源抢夺。
纵使你的工厂有一万条流水线 ...

对外表征就是速度,吞吐量低本身就是速度的指标
发表于 2024-8-8 16:56 | 显示全部楼层
自旋烧麦 发表于 2024-8-8 16:55
你在Intel cpu上面编译的程序,在AMD的cpu上也跑不到最佳能效
本来就是要找一个折中值 ...

你搁这玩玄学呢?
发表于 2024-8-8 17:07 | 显示全部楼层
自旋烧麦 发表于 2024-8-8 16:55
你在Intel cpu上面编译的程序,在AMD的cpu上也跑不到最佳能效
本来就是要找一个折中值 ...

如果程序很负责,准备了一系列针对各种处理器优化的中间件提供动态链接呢?
AMD就会动态到AMD,英特尔就会动态到英特尔。
即便都是AMD,Zen1就会是Zen1,推土机就是会是推土机。
只要是运行前识别,是可以做动态链接的。

但是要执行了一半中断再激活,这就没法中途改二进制程序了
发表于 2024-8-8 17:11 | 显示全部楼层
银月 发表于 2024-8-8 16:56
你搁这玩玄学呢?

这不就很基本的编译器优化知识点吗?
发表于 2024-8-8 17:12 | 显示全部楼层
大阴和AMD都搞大小核了,你一个B消费者,在这里说什么都不管用。有本事别买丫。
发表于 2024-8-8 17:13 | 显示全部楼层
本来就是,AMD早就是大小核了,双CCD都算大小核。因为两个CCD体质不同导致的频率不同
发表于 2024-8-8 17:13 | 显示全部楼层
PPXG 发表于 2024-8-8 17:11
这不就很基本的编译器优化知识点吗?

那就不会出现借对家编译器优化自己家代码的事了
发表于 2024-8-8 17:14 | 显示全部楼层
rx_78gp02a 发表于 2024-8-8 16:51
intel四个小核一个簇,共享同一个ring bus出口,2级缓存又小,存在资源抢夺。
纵使你的工厂有一万条流水线 ...

估摸着这玩意严重影响了N100的各种性能表现,甚至包括一些基本的日常操作N100很多人用的都说卡。倒是skymont看chipsandcheese说对这个做了改进,等出来看看是什么效果
发表于 2024-8-8 17:33 | 显示全部楼层
alieshex 发表于 2024-8-8 16:38
但是intel出现了avx能跑和不能跑的核,这是分配错了直接挂的

我同意确实没有谁比谁好

小核只是没有AVX512吧,大核也屏蔽了AVX512感觉没啥问题,AVX2大家都有就行了。另外除了模拟器之外还有哪些日常软件用这个指令集?我感觉我用的几个科学计算软件还没玩明白512呢
发表于 2024-8-8 17:39 | 显示全部楼层
银月 发表于 2024-8-8 17:13
那就不会出现借对家编译器优化自己家代码的事了

AMD在这方面积累不如英特尔呗,在EPYC上都不一定是OneAPI+Intel MKL快还是AOCC+AOCL快
发表于 2024-8-8 17:46 | 显示全部楼层
__|__ 发表于 2024-8-8 17:33
小核只是没有AVX512吧,大核也屏蔽了AVX512感觉没啥问题,AVX2大家都有就行了。另外除了模拟器之外还有哪 ...

前几代手机还有个核专门保留32位能力,凭啥电脑做不到非要全部屏蔽
发表于 2024-8-8 17:50 | 显示全部楼层
__|__ 发表于 2024-8-8 17:39
AMD在这方面积累不如英特尔呗,在EPYC上都不一定是OneAPI+Intel MKL快还是AOCC+AOCL快 ...

一般认为是intel私藏了某些设计给intel mkl用吧?
发表于 2024-8-8 17:55 | 显示全部楼层
这个标题就是个 没毛病的  废话

理论上是 这样的,异构也无所谓,前提是软件适配的好,有对于的正优化
但是  ,现实情况是 阿三搞出来的系统 优化不行  , 非异构会天然适配
 楼主| 发表于 2024-8-8 18:21 | 显示全部楼层
af_x_if 发表于 2024-8-8 17:07
如果程序很负责,准备了一系列针对各种处理器优化的中间件提供动态链接呢?
AMD就会动态到AMD,英特尔就 ...

这种情况下,AMD的同构小核心一样没法让大小核发挥最佳能效。
大的核心编译出来的二进制程序,会倾向于加载更多的Cache,这些Cache在小核心上就很容易触发缺页中断,导致额外的访存,然后大大降低性能
 楼主| 发表于 2024-8-8 18:23 | 显示全部楼层
银月 发表于 2024-8-8 16:56
你搁这玩玄学呢?

你的水平就是:上来就嘲讽,然后“搁这玩玄学呢“
 楼主| 发表于 2024-8-8 18:35 | 显示全部楼层
zhjook 发表于 2024-8-8 17:55
这个标题就是个 没毛病的  废话

理论上是 这样的,异构也无所谓,前提是软件适配的好,有对于的正优化

那为啥不直接说amd的小核心比intel的好?
很多人半桶水了解到amd是同构,intel是异构就说同构大小核更好
事实上也是amd的同构大小核因为核间延迟问题导致优化的更烂
 楼主| 发表于 2024-8-8 18:36 | 显示全部楼层
核心观点就是,大小核的优化好不好,是不是同构不是首要因素
发表于 2024-8-8 19:20 | 显示全部楼层
自旋烧麦 发表于 2024-8-8 18:35
那为啥不直接说amd的小核心比intel的好?
很多人半桶水了解到amd是同构,intel是异构就说同构大小核更好
...


图像_2024-08-08_192025655.png
移动端在优化的更烂的情况下还能暴打Intel全家是吧,这样会不会显得Intel很低能
发表于 2024-8-8 19:38 | 显示全部楼层
PPXG 发表于 2024-8-8 17:14
估摸着这玩意严重影响了N100的各种性能表现,甚至包括一些基本的日常操作N100很多人用的都说卡。倒是skym ...

n100是挺卡的,我以前买过,用了一段时间实在顶不住了,给卖了。。感觉是ring的频率也被阉割的很低,速度很慢,本来就共享一个出口,这下更挤了。。。正常CPU如果只调用小核其实没n100那么卡
发表于 2024-8-8 19:42 | 显示全部楼层
alieshex 发表于 2024-8-8 17:46
前几代手机还有个核专门保留32位能力,凭啥电脑做不到非要全部屏蔽

……兼容32位那叫向下兼容,屏蔽AVX512在MSDT上可以说没啥问题,毕竟说句应用场景很有限不过分
发表于 2024-8-8 19:44 | 显示全部楼层
alieshex 发表于 2024-8-8 17:50
一般认为是intel私藏了某些设计给intel mkl用吧?

不太懂这个私藏指的是什么意思,AMD又不是不能链接Intel MKL里面的库
发表于 2024-8-8 20:35 | 显示全部楼层
本帖最后由 af_x_if 于 2024-8-8 20:38 编辑
自旋烧麦 发表于 2024-8-8 18:21
这种情况下,AMD的同构小核心一样没法让大小核发挥最佳能效。
大的核心编译出来的二进制程序,会倾向于加 ...


缓存大小跟编译优化关系不大,可能L1的组关联数要考虑一下。

多核共享的L3更是抽象到单一应用的单一线程很难具体规划的地步。
发表于 2024-8-8 20:45 | 显示全部楼层
__|__ 发表于 2024-8-8 19:42
……兼容32位那叫向下兼容,屏蔽AVX512在MSDT上可以说没啥问题,毕竟说句应用场景很有限不过分 ...

emmm,确实没啥意义。
32位情况不太一样,是新核心不支持,但是保留某个核支持。开始是A55,之后是a710,a510。
cpu集群调用典型的比win好。
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-4-26 09:28 , Processed in 0.014937 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表