自旋烧麦 发表于 2024-8-8 16:13

没有所谓的同构大小核比异构大小核好的这种说法

不知道这种概念是谁先提出来的,纯属扯淡,类似的说法还有什么“AMD是高密度核和低密度核,不是大小核”之类的

1、首先,只要核心里面有快和慢两种核心,那就是大小核
2、对于操作系统的Dispatcher(分派器)来说,根本不会感知下面的CPU核心架构是一样还是不一样,只有快和慢两种
3、对于CPU自己的Dispatcher来说,会更加细分的基于具体指令快慢来进行分派,但是这也跟架构无关,具体指标是“执行速度”和具体的context

所谓同构大小核比异构大小核好,那是因为同构的核心一般性能更加接近,在错误分派的时候,体验gap没有那么大。这个问题出在调度而非小核心本身的架构。
如果一个处理器大核心和小核心架构天差地别,但是性能十分接近,那会比你同构大小核心但是性能差距很大感受更好。

重点在于大小核心的性能gap,而不是架构

darkness66201 发表于 2024-8-8 16:25

那又怎么样呢,现在intel那破烂异构大小核就是拉啊

af_x_if 发表于 2024-8-8 16:33

处理器指令吞吐指令延迟情况不一样,编译优化也不一样。
同一段功能,在两个兼容处理器上理论最佳的二进制可执行程序是不同的。

alieshex 发表于 2024-8-8 16:38

本帖最后由 alieshex 于 2024-8-8 16:58 编辑

但是intel出现了avx能跑和不能跑的核,这是分配错了直接挂的

我同意确实没有谁比谁好
但前提是你至少做到像手机soc那样的调度,而不是现在win这种残废的调度

rSkip 发表于 2024-8-8 16:40

编译器调参不一样,性能会不一样。小核上跑得最快的编译参数,在大核上跑,性能很可能不如默认参数

rx_78gp02a 发表于 2024-8-8 16:51

intel四个小核一个簇,共享同一个ring bus出口,2级缓存又小,存在资源抢夺。
纵使你的工厂有一万条流水线,但是仓库只有半平,出入口仅限一米宽,原料进出困难,再高的性能也会浪费在无尽的等待中。

自旋烧麦 发表于 2024-8-8 16:55

af_x_if 发表于 2024-8-8 16:33
处理器指令吞吐指令延迟情况不一样,编译优化也不一样。
同一段功能,在两个兼容处理器上理论最佳的二进制 ...

你在Intel cpu上面编译的程序,在AMD的cpu上也跑不到最佳能效
本来就是要找一个折中值

自旋烧麦 发表于 2024-8-8 16:56

rx_78gp02a 发表于 2024-8-8 16:51
intel四个小核一个簇,共享同一个ring bus出口,2级缓存又小,存在资源抢夺。
纵使你的工厂有一万条流水线 ...

对外表征就是速度,吞吐量低本身就是速度的指标

银月 发表于 2024-8-8 16:56

自旋烧麦 发表于 2024-8-8 16:55
你在Intel cpu上面编译的程序,在AMD的cpu上也跑不到最佳能效
本来就是要找一个折中值 ...

[震惊]你搁这玩玄学呢?

af_x_if 发表于 2024-8-8 17:07

自旋烧麦 发表于 2024-8-8 16:55
你在Intel cpu上面编译的程序,在AMD的cpu上也跑不到最佳能效
本来就是要找一个折中值 ...

如果程序很负责,准备了一系列针对各种处理器优化的中间件提供动态链接呢?
AMD就会动态到AMD,英特尔就会动态到英特尔。
即便都是AMD,Zen1就会是Zen1,推土机就是会是推土机。
只要是运行前识别,是可以做动态链接的。

但是要执行了一半中断再激活,这就没法中途改二进制程序了

PPXG 发表于 2024-8-8 17:11

银月 发表于 2024-8-8 16:56
你搁这玩玄学呢?

这不就很基本的编译器优化知识点吗?

cuixiang 发表于 2024-8-8 17:12

大阴和AMD都搞大小核了,你一个B消费者,在这里说什么都不管用。有本事别买丫。

HZJ 发表于 2024-8-8 17:13

本来就是,AMD早就是大小核了,双CCD都算大小核。因为两个CCD体质不同导致的频率不同

银月 发表于 2024-8-8 17:13

PPXG 发表于 2024-8-8 17:11
这不就很基本的编译器优化知识点吗?

[偷笑]那就不会出现借对家编译器优化自己家代码的事了

PPXG 发表于 2024-8-8 17:14

rx_78gp02a 发表于 2024-8-8 16:51
intel四个小核一个簇,共享同一个ring bus出口,2级缓存又小,存在资源抢夺。
纵使你的工厂有一万条流水线 ...

估摸着这玩意严重影响了N100的各种性能表现,甚至包括一些基本的日常操作[偷笑]N100很多人用的都说卡。倒是skymont看chipsandcheese说对这个做了改进,等出来看看是什么效果

__|__ 发表于 2024-8-8 17:33

alieshex 发表于 2024-8-8 16:38
但是intel出现了avx能跑和不能跑的核,这是分配错了直接挂的

我同意确实没有谁比谁好


小核只是没有AVX512吧,大核也屏蔽了AVX512感觉没啥问题,AVX2大家都有就行了。另外除了模拟器之外还有哪些日常软件用这个指令集?我感觉我用的几个科学计算软件还没玩明白512呢[偷笑]

__|__ 发表于 2024-8-8 17:39

银月 发表于 2024-8-8 17:13
那就不会出现借对家编译器优化自己家代码的事了

AMD在这方面积累不如英特尔呗,在EPYC上都不一定是OneAPI+Intel MKL快还是AOCC+AOCL快

alieshex 发表于 2024-8-8 17:46

__|__ 发表于 2024-8-8 17:33
小核只是没有AVX512吧,大核也屏蔽了AVX512感觉没啥问题,AVX2大家都有就行了。另外除了模拟器之外还有哪 ...

前几代手机还有个核专门保留32位能力,凭啥电脑做不到非要全部屏蔽

alieshex 发表于 2024-8-8 17:50

__|__ 发表于 2024-8-8 17:39
AMD在这方面积累不如英特尔呗,在EPYC上都不一定是OneAPI+Intel MKL快还是AOCC+AOCL快 ...

一般认为是intel私藏了某些设计给intel mkl用吧?

zhjook 发表于 2024-8-8 17:55

这个标题就是个 没毛病的废话

理论上是 这样的,异构也无所谓,前提是软件适配的好,有对于的正优化
但是,现实情况是 阿三搞出来的系统 优化不行, 非异构会天然适配

自旋烧麦 发表于 2024-8-8 18:21

af_x_if 发表于 2024-8-8 17:07
如果程序很负责,准备了一系列针对各种处理器优化的中间件提供动态链接呢?
AMD就会动态到AMD,英特尔就 ...

这种情况下,AMD的同构小核心一样没法让大小核发挥最佳能效。
大的核心编译出来的二进制程序,会倾向于加载更多的Cache,这些Cache在小核心上就很容易触发缺页中断,导致额外的访存,然后大大降低性能

自旋烧麦 发表于 2024-8-8 18:23

银月 发表于 2024-8-8 16:56
你搁这玩玄学呢?

你的水平就是:上来就嘲讽,然后“搁这玩玄学呢“

自旋烧麦 发表于 2024-8-8 18:35

zhjook 发表于 2024-8-8 17:55
这个标题就是个 没毛病的废话

理论上是 这样的,异构也无所谓,前提是软件适配的好,有对于的正优化


那为啥不直接说amd的小核心比intel的好?
很多人半桶水了解到amd是同构,intel是异构就说同构大小核更好
事实上也是amd的同构大小核因为核间延迟问题导致优化的更烂

自旋烧麦 发表于 2024-8-8 18:36

核心观点就是,大小核的优化好不好,是不是同构不是首要因素

灵乌路空 发表于 2024-8-8 19:20

自旋烧麦 发表于 2024-8-8 18:35
那为啥不直接说amd的小核心比intel的好?
很多人半桶水了解到amd是同构,intel是异构就说同构大小核更好
...


移动端在优化的更烂的情况下还能暴打Intel全家是吧,这样会不会显得Intel很低能[偷笑]

rico19375 发表于 2024-8-8 19:38

PPXG 发表于 2024-8-8 17:14
估摸着这玩意严重影响了N100的各种性能表现,甚至包括一些基本的日常操作N100很多人用的都说卡。倒是skym ...

n100是挺卡的,我以前买过,用了一段时间实在顶不住了,给卖了。。感觉是ring的频率也被阉割的很低,速度很慢,本来就共享一个出口,这下更挤了。。。正常CPU如果只调用小核其实没n100那么卡

__|__ 发表于 2024-8-8 19:42

alieshex 发表于 2024-8-8 17:46
前几代手机还有个核专门保留32位能力,凭啥电脑做不到非要全部屏蔽

……兼容32位那叫向下兼容,屏蔽AVX512在MSDT上可以说没啥问题,毕竟说句应用场景很有限不过分

__|__ 发表于 2024-8-8 19:44

alieshex 发表于 2024-8-8 17:50
一般认为是intel私藏了某些设计给intel mkl用吧?

不太懂这个私藏指的是什么意思,AMD又不是不能链接Intel MKL里面的库

af_x_if 发表于 2024-8-8 20:35

本帖最后由 af_x_if 于 2024-8-8 20:38 编辑

自旋烧麦 发表于 2024-8-8 18:21
这种情况下,AMD的同构小核心一样没法让大小核发挥最佳能效。
大的核心编译出来的二进制程序,会倾向于加 ...

缓存大小跟编译优化关系不大,可能L1的组关联数要考虑一下。

多核共享的L3更是抽象到单一应用的单一线程很难具体规划的地步。

alieshex 发表于 2024-8-8 20:45

__|__ 发表于 2024-8-8 19:42
……兼容32位那叫向下兼容,屏蔽AVX512在MSDT上可以说没啥问题,毕竟说句应用场景很有限不过分 ...

emmm,确实没啥意义。
32位情况不太一样,是新核心不支持,但是保留某个核支持。开始是A55,之后是a710,a510。
cpu集群调用典型的比win好。
页: [1] 2
查看完整版本: 没有所谓的同构大小核比异构大小核好的这种说法