找回密码
 加入我们
搜索
      
查看: 6689|回复: 35

[CPU] Xeon6终结了单路打双路的时代,然而。。。。

[复制链接]
发表于 2024-10-11 04:16 | 显示全部楼层 |阅读模式
大英:没事我功耗赢了,赢就是赢


发表于 2024-10-13 19:02 来自手机 | 显示全部楼层
牙膏是QS就来刷榜了,有点意思
发表于 2024-10-13 18:59 | 显示全部楼层
gihu 发表于 2024-10-12 21:08
我怎么觉得xeon性能不占优还有核间互联效率低的锅

我不知道你说的效率是哪方面的,性能方面mesh的性能不存在,有问题的是面积效率,mesh agent需要的面积比ring agent大得多,但目前mesh更低的20c+ core to core latency优势又未能展现出和面积增幅成正比的性能增幅。其次是SPR开始又多了个占了一堆面积的amx,而amx完完全全就是ai专用的asic,对于dc/hpc的提升为0,反馈到overall performance improvement也是和mesh一样低于面积增幅。只不过SRF也已经预示了牙膏未来P-core xeon的互联要怎么做了。现在只能先把euv和建厂的投入先回收再说,利润率的问题26年之前都不会有救。
发表于 2024-10-13 11:22 | 显示全部楼层
847681220 发表于 2024-10-11 06:59
这次居然有9175f了16个ccd每个只开1核,恐怖

某些特定的专业软件是按核心数量收费的。

并且那种软件价格贵得可怕,CPU那点钱直接忽略不计。

所以要专门出一种CPU,每一个核心都能享受到极致的资源,以充分利用软件授权。
发表于 2024-10-13 11:13 | 显示全部楼层
847681220 发表于 2024-10-11 06:59
这次居然有9175f了16个ccd每个只开1核,恐怖

ZEN2 EPYC就有先例了 ,估计是屏蔽坏芯片尝到甜头了 ,继续干 ,不浪费一个die
发表于 2024-10-12 21:08 | 显示全部楼层
5d5588cf 发表于 2024-10-12 19:58
同样360W 9654核心比9554多50%性能只多9%,9755功耗比9575f多25%核心翻倍也只不过多22%性能,所以多核sca ...

我怎么觉得xeon性能不占优还有核间互联效率低的锅
发表于 2024-10-12 19:58 | 显示全部楼层
本帖最后由 5d5588cf 于 2024-10-12 20:03 编辑
darkness66201 发表于 2024-10-12 18:24
高频本身就已经是一种削弱能耗比的方式了,在少了25%功耗少了一半核心的情况下都能打平,恰恰说明牙膏有 ...


同样360W 9654核心比9554多50%性能只多9%,9755功耗比9575f多25%核心翻倍也只不过多22%性能,所以多核scaling的问题不是只出现在牙膏的平台上,没必要这样比。牙膏的问题不在于能耗比还是性能差距,6980p和9755相比差20%也远不到致命的程度,问题在于成本。同样128c 6980p的成本比9755贵大概50-70%,这是用hp library的历史遗留问题。hp library在服务器这种几乎都0.85v内运作的平台上是捞不到半点好处。也就工作站平台会有些影响。
发表于 2024-10-12 19:51 | 显示全部楼层
darkness66201 发表于 2024-10-12 18:24
高频本身就已经是一种削弱能耗比的方式了,在少了25%功耗少了一半核心的情况下都能打平,恰恰说明牙膏有 ...

能耗比上,牙膏最新产品甚至还远远没法挑战2年前的zen4。我说的只是性能上有和zen4 x3d和zen5中端一较高下的资格,这和zen2、zen3时xeon连上上代epyc都打不过的情况也算有所进步了。
发表于 2024-10-12 18:24 来自手机 | 显示全部楼层
gihu 发表于 2024-10-12 15:47
9575F可是5G的boost频率啊,人家这个64核,比起Xeon6 3.9G的高了可是有30%。
在服务器领域,能耗比牙膏真 ...

高频本身就已经是一种削弱能耗比的方式了,在少了25%功耗少了一半核心的情况下都能打平,恰恰说明牙膏有多弱。偏偏服务器就看能耗比,总算力,计算密度这些东西,牙膏的问题看起来还真的不是说一代半代架构的问题。
发表于 2024-10-12 15:47 | 显示全部楼层
darkness66201 发表于 2024-10-12 15:36
算了吧,你不要只盯着最上面2P的对比,看看下面的,intel3 128核心 6980P 1P 550W和N4P 64核心的9575F 40 ...

9575F可是5G的boost频率啊,人家这个64核,比起Xeon6 3.9G的高了可是有30%。
在服务器领域,能耗比牙膏真的没法跟农企竞争,就不谈了。
发表于 2024-10-12 15:36 来自手机 | 显示全部楼层
gihu 发表于 2024-10-12 14:54
说点赢特尔赢的点,6代xeon用的是redwood cove内核,就相当于Ultra 1xx的P核,而Arrow lake的内核的xeon应 ...

算了吧,你不要只盯着最上面2P的对比,看看下面的,intel3 128核心 6980P 1P 550W和N4P 64核心的9575F 400W跑一个水平,这代差换个架构可救不了,实际上论能耗比6980P和9654都还差一大截呢,和zen5更没法比了。
发表于 2024-10-12 15:22 | 显示全部楼层
赫敏 发表于 2024-10-12 15:09
用了lion cove不应该是倒吸2%嘛

lion cove 相对raptor cove倒吸,也是因为raptor cove频率可以更高,但相对redwood cove可没有这个缺点了
 楼主| 发表于 2024-10-12 15:09 | 显示全部楼层
gihu 发表于 2024-10-12 01:54
说点赢特尔赢的点,6代xeon用的是redwood cove内核,就相当于Ultra 1xx的P核,而Arrow lake的内核的xeon应 ...

用了lion cove不应该是倒吸2%嘛
发表于 2024-10-12 14:58 | 显示全部楼层
牙膏厂这双路提升还不到20%就属于很抽象了,单路打不过~~~差距20%,双路还是打不过~~~只差一点点
发表于 2024-10-12 14:54 | 显示全部楼层
说点赢特尔赢的点,6代xeon用的是redwood cove内核,就相当于Ultra 1xx的P核,而Arrow lake的内核的xeon应该会更强。
按这个节奏,貌似采用Lion cove大核的7代xeon,有望和zen5 epyc旗鼓相当?
 楼主| 发表于 2024-10-12 14:14 | 显示全部楼层
阿诺德施瓦辛格 发表于 2024-10-11 22:34
单路输2成,功耗多一点,针不戳了讲真

不戳,奖励价格贵40%
发表于 2024-10-12 14:00 | 显示全部楼层
Illidan2004 发表于 2024-10-11 16:06
单核大缓存工业软件专用?

不过也正常 16个CCD 应该是8核一个,每两个8核一组,上面叠1个64MB L3吧,所 ...

这个应该就是32M x16=512M L3 ,而不是64Mx8,现在amd还没有跨ccd共享L3的技术
发表于 2024-10-12 13:31 | 显示全部楼层
赫敏 发表于 2024-10-12 12:32
12通道6400带宽也就50g*12,16核怎么跑不满了

没仔细算带宽,这么讲倒是刚刚好
 楼主| 发表于 2024-10-12 12:59 | 显示全部楼层
archxm 发表于 2024-10-11 23:50
把 java 换 c++试试

应该本来就用c++重写了spark
发表于 2024-10-12 12:50 来自手机 | 显示全部楼层
赫敏 发表于 2024-10-12 12:47
这才哪到哪啊,蚂蚁金服一个集群跑个分就300多台双路在跑
https://www.tpc.org/tpch/results/tpch_result ...

把 java 换 c++试试
 楼主| 发表于 2024-10-12 12:47 | 显示全部楼层
archxm 发表于 2024-10-11 22:36
哪些领域需要这么多高性能啊?

这才哪到哪啊,蚂蚁金服一个集群跑个分就300多台双路在跑
https://www.tpc.org/tpch/results ... version=3&lang=
 楼主| 发表于 2024-10-12 12:32 | 显示全部楼层
skyfish 发表于 2024-10-11 22:26
这么设计其实在内存带宽上会有问题的,因为单CCD的读写访存带宽是100G左右,但是每个core的读写访存大约 ...

12通道6400带宽也就50g*12,16核怎么跑不满了
发表于 2024-10-12 11:36 来自手机 | 显示全部楼层
哪些领域需要这么多高性能啊?
发表于 2024-10-12 11:34 | 显示全部楼层
单路输2成,功耗多一点,针不戳了讲真
发表于 2024-10-12 11:26 | 显示全部楼层
Illidan2004 发表于 2024-10-11 16:06
单核大缓存工业软件专用?

不过也正常 16个CCD 应该是8核一个,每两个8核一组,上面叠1个64MB L3吧,所 ...

这么设计其实在内存带宽上会有问题的,因为单CCD的读写访存带宽是100G左右,但是每个core的读写访存大约只有50G,也就是说这个sku的峰值内存带宽是跑不满的
发表于 2024-10-11 16:22 | 显示全部楼层
2P这个数据不太对啊  
1P性能差距看来不大  6长进不少
发表于 2024-10-11 16:10 | 显示全部楼层
skyfish 发表于 2024-10-11 09:44
这个测试中1socket其实zen5和xeon6差距并不大,不过很迷的是,为啥intel的2P性能这么差? ...

是有点奇怪
发表于 2024-10-11 16:06 | 显示全部楼层
本帖最后由 Illidan2004 于 2024-10-11 16:09 编辑
847681220 发表于 2024-10-11 06:59
这次居然有9175f了16个ccd每个只开1核,恐怖


单核大缓存工业软件专用?

不过也正常 16个CCD 应该是8核一个,每两个8核一组,上面叠1个64MB L3吧,所以现在还是相当于8核开了1核,64M*8的L3
发表于 2024-10-11 15:31 | 显示全部楼层

Screenshot 2024-10-11 144205.jpg
EMR ppt号称平均1.21x,实际评测1.23x


Screenshot 2024-10-11 145122.jpg
GNR ppt号称2.3x,实际1.6x。
考虑到EMR是去年12月才发,而GNR则是仅仅隔了9个月。而且1S/2S的数据也不对路,不管是牙膏还是农企其他sku 2S的性能都是介乎1S的1.4-1.5x,而6980p仅为1.2x,显然是没优化好就送去评测了。单纯用账面的int/fp算力去看,6980p再不济也应该比8592+强个1.8-2x。就算打平都做不到也不至于被人1s打2s,毕竟连因为多socket出bug修十几个stepping的SPR的2S倍率都没特别低,而4个月前的SRF也是没问题的。大概就是为了赶在Turin前面送测,毕竟就算没优化好的情况下打Genoa至少还是能赢,优化好之后打Turin就算输得少还是输。
发表于 2024-10-11 09:44 | 显示全部楼层
这个测试中1socket其实zen5和xeon6差距并不大,不过很迷的是,为啥intel的2P性能这么差?
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-7-6 20:09 , Processed in 0.014632 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表