Xeon6终结了单路打双路的时代，然而。。。。

赫敏 · 发表于 2024-10-11 04:16

大英：没事我功耗赢了，赢就是赢

巴特沃斯 · 发表于 2024-10-13 19:02

牙膏是QS就来刷榜了,有点意思

5d5588cf · 发表于 2024-10-13 18:59

gihu 发表于 2024-10-12 21:08
我怎么觉得xeon性能不占优还有核间互联效率低的锅

我不知道你说的效率是哪方面的，性能方面mesh的性能不存在，有问题的是面积效率，mesh agent需要的面积比ring agent大得多，但目前mesh更低的20c+ core to core latency优势又未能展现出和面积增幅成正比的性能增幅。其次是SPR开始又多了个占了一堆面积的amx，而amx完完全全就是ai专用的asic，对于dc/hpc的提升为0，反馈到overall performance improvement也是和mesh一样低于面积增幅。只不过SRF也已经预示了牙膏未来P-core xeon的互联要怎么做了。现在只能先把euv和建厂的投入先回收再说，利润率的问题26年之前都不会有救。

Mufasa · 发表于 2024-10-13 11:22

847681220 发表于 2024-10-11 06:59
这次居然有9175f了16个ccd每个只开1核，恐怖

某些特定的专业软件是按核心数量收费的。

并且那种软件价格贵得可怕，CPU那点钱直接忽略不计。

所以要专门出一种CPU，每一个核心都能享受到极致的资源，以充分利用软件授权。

geli · 发表于 2024-10-13 11:13

847681220 发表于 2024-10-11 06:59
这次居然有9175f了16个ccd每个只开1核，恐怖

ZEN2 EPYC就有先例了，估计是屏蔽坏芯片尝到甜头了，继续干，不浪费一个die

gihu · 发表于 2024-10-12 21:08

5d5588cf 发表于 2024-10-12 19:58
同样360W 9654核心比9554多50%性能只多9%，9755功耗比9575f多25%核心翻倍也只不过多22%性能，所以多核sca ...

我怎么觉得xeon性能不占优还有核间互联效率低的锅

5d5588cf · 发表于 2024-10-12 19:58

本帖最后由 5d5588cf 于 2024-10-12 20:03 编辑

darkness66201 发表于 2024-10-12 18:24
高频本身就已经是一种削弱能耗比的方式了，在少了25%功耗少了一半核心的情况下都能打平，恰恰说明牙膏有 ...

同样360W 9654核心比9554多50%性能只多9%，9755功耗比9575f多25%核心翻倍也只不过多22%性能，所以多核scaling的问题不是只出现在牙膏的平台上，没必要这样比。牙膏的问题不在于能耗比还是性能差距，6980p和9755相比差20%也远不到致命的程度，问题在于成本。同样128c 6980p的成本比9755贵大概50-70%，这是用hp library的历史遗留问题。hp library在服务器这种几乎都0.85v内运作的平台上是捞不到半点好处。也就工作站平台会有些影响。

gihu · 发表于 2024-10-12 19:51

darkness66201 发表于 2024-10-12 18:24
高频本身就已经是一种削弱能耗比的方式了，在少了25%功耗少了一半核心的情况下都能打平，恰恰说明牙膏有 ...

能耗比上，牙膏最新产品甚至还远远没法挑战2年前的zen4。我说的只是性能上有和zen4 x3d和zen5中端一较高下的资格，这和zen2、zen3时xeon连上上代epyc都打不过的情况也算有所进步了。

darkness66201 · 发表于 2024-10-12 18:24

gihu 发表于 2024-10-12 15:47
9575F可是5G的boost频率啊，人家这个64核，比起Xeon6 3.9G的高了可是有30%。
在服务器领域，能耗比牙膏真 ...

高频本身就已经是一种削弱能耗比的方式了，在少了25%功耗少了一半核心的情况下都能打平，恰恰说明牙膏有多弱。偏偏服务器就看能耗比，总算力，计算密度这些东西，牙膏的问题看起来还真的不是说一代半代架构的问题。

gihu · 发表于 2024-10-12 15:47

darkness66201 发表于 2024-10-12 15:36
算了吧，你不要只盯着最上面2P的对比，看看下面的，intel3 128核心 6980P 1P 550W和N4P 64核心的9575F 40 ...

9575F可是5G的boost频率啊，人家这个64核，比起Xeon6 3.9G的高了可是有30%。
在服务器领域，能耗比牙膏真的没法跟农企竞争，就不谈了。

darkness66201 · 发表于 2024-10-12 15:36

gihu 发表于 2024-10-12 14:54
说点赢特尔赢的点，6代xeon用的是redwood cove内核，就相当于Ultra 1xx的P核，而Arrow lake的内核的xeon应 ...

算了吧，你不要只盯着最上面2P的对比，看看下面的，intel3 128核心 6980P 1P 550W和N4P 64核心的9575F 400W跑一个水平，这代差换个架构可救不了，实际上论能耗比6980P和9654都还差一大截呢，和zen5更没法比了。

gihu · 发表于 2024-10-12 15:22

赫敏发表于 2024-10-12 15:09
用了lion cove不应该是倒吸2%嘛

lion cove 相对raptor cove倒吸，也是因为raptor cove频率可以更高，但相对redwood cove可没有这个缺点了

赫敏 · 发表于 2024-10-12 15:09

gihu 发表于 2024-10-12 01:54
说点赢特尔赢的点，6代xeon用的是redwood cove内核，就相当于Ultra 1xx的P核，而Arrow lake的内核的xeon应 ...

用了lion cove不应该是倒吸2%嘛

lacsiess · 发表于 2024-10-12 14:58

牙膏厂这双路提升还不到20%就属于很抽象了,单路打不过~~~差距20%,双路还是打不过~~~只差一点点

gihu · 发表于 2024-10-12 14:54

说点赢特尔赢的点，6代xeon用的是redwood cove内核，就相当于Ultra 1xx的P核，而Arrow lake的内核的xeon应该会更强。
按这个节奏，貌似采用Lion cove大核的7代xeon，有望和zen5 epyc旗鼓相当？

赫敏 · 发表于 2024-10-12 14:14

阿诺德施瓦辛格发表于 2024-10-11 22:34
单路输2成，功耗多一点，针不戳了讲真

不戳，奖励价格贵40%

gihu · 发表于 2024-10-12 14:00

Illidan2004 发表于 2024-10-11 16:06
单核大缓存工业软件专用？

不过也正常 16个CCD 应该是8核一个，每两个8核一组，上面叠1个64MB L3吧，所 ...

这个应该就是32M x16=512M L3 ，而不是64Mx8，现在amd还没有跨ccd共享L3的技术

skyfish · 发表于 2024-10-12 13:31

赫敏发表于 2024-10-12 12:32
12通道6400带宽也就50g*12，16核怎么跑不满了

没仔细算带宽，这么讲倒是刚刚好

赫敏 · 发表于 2024-10-12 12:59

archxm 发表于 2024-10-11 23:50
把 java 换 c++试试

应该本来就用c++重写了spark

archxm · 发表于 2024-10-12 12:50

赫敏发表于 2024-10-12 12:47
这才哪到哪啊，蚂蚁金服一个集群跑个分就300多台双路在跑
https://www.tpc.org/tpch/results/tpch_result ...

把 java 换 c++试试

赫敏 · 发表于 2024-10-12 12:47

archxm 发表于 2024-10-11 22:36
哪些领域需要这么多高性能啊？

这才哪到哪啊，蚂蚁金服一个集群跑个分就300多台双路在跑
https://www.tpc.org/tpch/results ... version=3&lang=

赫敏 · 发表于 2024-10-12 12:32

skyfish 发表于 2024-10-11 22:26
这么设计其实在内存带宽上会有问题的，因为单CCD的读写访存带宽是100G左右，但是每个core的读写访存大约 ...

12通道6400带宽也就50g*12，16核怎么跑不满了

archxm · 发表于 2024-10-12 11:36

哪些领域需要这么多高性能啊？

阿诺德施瓦辛格 · 发表于 2024-10-12 11:34

单路输2成，功耗多一点，针不戳了讲真

skyfish · 发表于 2024-10-12 11:26

Illidan2004 发表于 2024-10-11 16:06
单核大缓存工业软件专用？

不过也正常 16个CCD 应该是8核一个，每两个8核一组，上面叠1个64MB L3吧，所 ...

这么设计其实在内存带宽上会有问题的，因为单CCD的读写访存带宽是100G左右，但是每个core的读写访存大约只有50G，也就是说这个sku的峰值内存带宽是跑不满的

momo77989724 · 发表于 2024-10-11 16:22

2P这个数据不太对啊
1P性能差距看来不大 6长进不少

Illidan2004 · 发表于 2024-10-11 16:10

skyfish 发表于 2024-10-11 09:44
这个测试中1socket其实zen5和xeon6差距并不大，不过很迷的是，为啥intel的2P性能这么差？ ...

是有点奇怪

Illidan2004 · 发表于 2024-10-11 16:06

本帖最后由 Illidan2004 于 2024-10-11 16:09 编辑

847681220 发表于 2024-10-11 06:59
这次居然有9175f了16个ccd每个只开1核，恐怖

单核大缓存工业软件专用？

不过也正常 16个CCD 应该是8核一个，每两个8核一组，上面叠1个64MB L3吧，所以现在还是相当于8核开了1核，64M*8的L3

5d5588cf · 发表于 2024-10-11 15:31

EMR ppt号称平均1.21x，实际评测1.23x

GNR ppt号称2.3x，实际1.6x。
考虑到EMR是去年12月才发，而GNR则是仅仅隔了9个月。而且1S/2S的数据也不对路，不管是牙膏还是农企其他sku 2S的性能都是介乎1S的1.4-1.5x，而6980p仅为1.2x，显然是没优化好就送去评测了。单纯用账面的int/fp算力去看，6980p再不济也应该比8592+强个1.8-2x。就算打平都做不到也不至于被人1s打2s，毕竟连因为多socket出bug修十几个stepping的SPR的2S倍率都没特别低，而4个月前的SRF也是没问题的。大概就是为了赶在Turin前面送测，毕竟就算没优化好的情况下打Genoa至少还是能赢，优化好之后打Turin就算输得少还是输。

skyfish · 发表于 2024-10-11 09:44

这个测试中1socket其实zen5和xeon6差距并不大，不过很迷的是，为啥intel的2P性能这么差？

账号		自动登录	找回密码
密码			加入我们

[CPU] Xeon6终结了单路打双路的时代，然而。。。。

浏览过的版块