没有所谓的同构大小核比异构大小核好的这种说法

自旋烧麦 发表于 2024-8-8 16:13

不知道这种概念是谁先提出来的，纯属扯淡，类似的说法还有什么“AMD是高密度核和低密度核，不是大小核”之类的

1、首先，只要核心里面有快和慢两种核心，那就是大小核
2、对于操作系统的Dispatcher(分派器)来说，根本不会感知下面的CPU核心架构是一样还是不一样，只有快和慢两种
3、对于CPU自己的Dispatcher来说，会更加细分的基于具体指令快慢来进行分派，但是这也跟架构无关，具体指标是“执行速度”和具体的context

所谓同构大小核比异构大小核好，那是因为同构的核心一般性能更加接近，在错误分派的时候，体验gap没有那么大。这个问题出在调度而非小核心本身的架构。
如果一个处理器大核心和小核心架构天差地别，但是性能十分接近，那会比你同构大小核心但是性能差距很大感受更好。

重点在于大小核心的性能gap，而不是架构

darkness66201 发表于 2024-8-8 16:25

那又怎么样呢，现在intel那破烂异构大小核就是拉啊

af_x_if 发表于 2024-8-8 16:33

处理器指令吞吐指令延迟情况不一样，编译优化也不一样。
同一段功能，在两个兼容处理器上理论最佳的二进制可执行程序是不同的。

alieshex 发表于 2024-8-8 16:38

本帖最后由 alieshex 于 2024-8-8 16:58 编辑

但是intel出现了avx能跑和不能跑的核，这是分配错了直接挂的

我同意确实没有谁比谁好
但前提是你至少做到像手机soc那样的调度，而不是现在win这种残废的调度

rSkip 发表于 2024-8-8 16:40

编译器调参不一样，性能会不一样。小核上跑得最快的编译参数，在大核上跑，性能很可能不如默认参数

rx_78gp02a 发表于 2024-8-8 16:51

intel四个小核一个簇，共享同一个ring bus出口，2级缓存又小，存在资源抢夺。
纵使你的工厂有一万条流水线，但是仓库只有半平，出入口仅限一米宽，原料进出困难，再高的性能也会浪费在无尽的等待中。

自旋烧麦 发表于 2024-8-8 16:55

af_x_if 发表于 2024-8-8 16:33
处理器指令吞吐指令延迟情况不一样，编译优化也不一样。
同一段功能，在两个兼容处理器上理论最佳的二进制 ...

你在Intel cpu上面编译的程序，在AMD的cpu上也跑不到最佳能效
本来就是要找一个折中值

自旋烧麦 发表于 2024-8-8 16:56

rx_78gp02a 发表于 2024-8-8 16:51
intel四个小核一个簇，共享同一个ring bus出口，2级缓存又小，存在资源抢夺。
纵使你的工厂有一万条流水线 ...

对外表征就是速度，吞吐量低本身就是速度的指标

银月发表于 2024-8-8 16:56

自旋烧麦发表于 2024-8-8 16:55
你在Intel cpu上面编译的程序，在AMD的cpu上也跑不到最佳能效
本来就是要找一个折中值 ...

[震惊]你搁这玩玄学呢？

af_x_if 发表于 2024-8-8 17:07

自旋烧麦发表于 2024-8-8 16:55
你在Intel cpu上面编译的程序，在AMD的cpu上也跑不到最佳能效
本来就是要找一个折中值 ...

如果程序很负责，准备了一系列针对各种处理器优化的中间件提供动态链接呢？
AMD就会动态到AMD，英特尔就会动态到英特尔。
即便都是AMD，Zen1就会是Zen1，推土机就是会是推土机。
只要是运行前识别，是可以做动态链接的。

但是要执行了一半中断再激活，这就没法中途改二进制程序了

PPXG 发表于 2024-8-8 17:11

银月发表于 2024-8-8 16:56
你搁这玩玄学呢？

这不就很基本的编译器优化知识点吗？

cuixiang 发表于 2024-8-8 17:12

大阴和AMD都搞大小核了，你一个B消费者，在这里说什么都不管用。有本事别买丫。

HZJ 发表于 2024-8-8 17:13

本来就是，AMD早就是大小核了，双CCD都算大小核。因为两个CCD体质不同导致的频率不同

银月发表于 2024-8-8 17:13

PPXG 发表于 2024-8-8 17:11
这不就很基本的编译器优化知识点吗？

[偷笑]那就不会出现借对家编译器优化自己家代码的事了

PPXG 发表于 2024-8-8 17:14

rx_78gp02a 发表于 2024-8-8 16:51
intel四个小核一个簇，共享同一个ring bus出口，2级缓存又小，存在资源抢夺。
纵使你的工厂有一万条流水线 ...

估摸着这玩意严重影响了N100的各种性能表现，甚至包括一些基本的日常操作[偷笑]N100很多人用的都说卡。倒是skymont看chipsandcheese说对这个做了改进，等出来看看是什么效果

__|__ 发表于 2024-8-8 17:33

alieshex 发表于 2024-8-8 16:38
但是intel出现了avx能跑和不能跑的核，这是分配错了直接挂的

我同意确实没有谁比谁好

小核只是没有AVX512吧，大核也屏蔽了AVX512感觉没啥问题，AVX2大家都有就行了。另外除了模拟器之外还有哪些日常软件用这个指令集？我感觉我用的几个科学计算软件还没玩明白512呢[偷笑]

__|__ 发表于 2024-8-8 17:39

银月发表于 2024-8-8 17:13
那就不会出现借对家编译器优化自己家代码的事了

AMD在这方面积累不如英特尔呗，在EPYC上都不一定是OneAPI+Intel MKL快还是AOCC+AOCL快

alieshex 发表于 2024-8-8 17:46

__|__ 发表于 2024-8-8 17:33
小核只是没有AVX512吧，大核也屏蔽了AVX512感觉没啥问题，AVX2大家都有就行了。另外除了模拟器之外还有哪 ...

前几代手机还有个核专门保留32位能力，凭啥电脑做不到非要全部屏蔽

alieshex 发表于 2024-8-8 17:50

__|__ 发表于 2024-8-8 17:39
AMD在这方面积累不如英特尔呗，在EPYC上都不一定是OneAPI+Intel MKL快还是AOCC+AOCL快 ...

一般认为是intel私藏了某些设计给intel mkl用吧？

zhjook 发表于 2024-8-8 17:55

这个标题就是个没毛病的废话

理论上是这样的，异构也无所谓，前提是软件适配的好，有对于的正优化
但是，现实情况是阿三搞出来的系统优化不行，非异构会天然适配

自旋烧麦 发表于 2024-8-8 18:21

af_x_if 发表于 2024-8-8 17:07
如果程序很负责，准备了一系列针对各种处理器优化的中间件提供动态链接呢？
AMD就会动态到AMD，英特尔就 ...

这种情况下，AMD的同构小核心一样没法让大小核发挥最佳能效。
大的核心编译出来的二进制程序，会倾向于加载更多的Cache，这些Cache在小核心上就很容易触发缺页中断，导致额外的访存，然后大大降低性能

自旋烧麦 发表于 2024-8-8 18:23

银月发表于 2024-8-8 16:56
你搁这玩玄学呢？

你的水平就是：上来就嘲讽，然后“搁这玩玄学呢“

自旋烧麦 发表于 2024-8-8 18:35

zhjook 发表于 2024-8-8 17:55
这个标题就是个没毛病的废话

理论上是这样的，异构也无所谓，前提是软件适配的好，有对于的正优化

那为啥不直接说amd的小核心比intel的好？
很多人半桶水了解到amd是同构，intel是异构就说同构大小核更好
事实上也是amd的同构大小核因为核间延迟问题导致优化的更烂

自旋烧麦 发表于 2024-8-8 18:36

核心观点就是，大小核的优化好不好，是不是同构不是首要因素

灵乌路空 发表于 2024-8-8 19:20

自旋烧麦发表于 2024-8-8 18:35
那为啥不直接说amd的小核心比intel的好？
很多人半桶水了解到amd是同构，intel是异构就说同构大小核更好
...

移动端在优化的更烂的情况下还能暴打Intel全家是吧，这样会不会显得Intel很低能[偷笑]

rico19375 发表于 2024-8-8 19:38

PPXG 发表于 2024-8-8 17:14
估摸着这玩意严重影响了N100的各种性能表现，甚至包括一些基本的日常操作N100很多人用的都说卡。倒是skym ...

n100是挺卡的，我以前买过，用了一段时间实在顶不住了，给卖了。。感觉是ring的频率也被阉割的很低，速度很慢，本来就共享一个出口，这下更挤了。。。正常CPU如果只调用小核其实没n100那么卡

__|__ 发表于 2024-8-8 19:42

alieshex 发表于 2024-8-8 17:46
前几代手机还有个核专门保留32位能力，凭啥电脑做不到非要全部屏蔽

……兼容32位那叫向下兼容，屏蔽AVX512在MSDT上可以说没啥问题，毕竟说句应用场景很有限不过分

__|__ 发表于 2024-8-8 19:44

alieshex 发表于 2024-8-8 17:50
一般认为是intel私藏了某些设计给intel mkl用吧？

不太懂这个私藏指的是什么意思，AMD又不是不能链接Intel MKL里面的库

af_x_if 发表于 2024-8-8 20:35

本帖最后由 af_x_if 于 2024-8-8 20:38 编辑

自旋烧麦发表于 2024-8-8 18:21
这种情况下，AMD的同构小核心一样没法让大小核发挥最佳能效。
大的核心编译出来的二进制程序，会倾向于加 ...

缓存大小跟编译优化关系不大，可能L1的组关联数要考虑一下。

多核共享的L3更是抽象到单一应用的单一线程很难具体规划的地步。

alieshex 发表于 2024-8-8 20:45

__|__ 发表于 2024-8-8 19:42
……兼容32位那叫向下兼容，屏蔽AVX512在MSDT上可以说没啥问题，毕竟说句应用场景很有限不过分 ...

emmm，确实没啥意义。
32位情况不太一样，是新核心不支持，但是保留某个核支持。开始是A55，之后是a710，a510。
cpu集群调用典型的比win好。

页: [1] 2

Chiphell - 分享与交流用户体验's Archiver

没有所谓的同构大小核比异构大小核好的这种说法