momo77989724 发表于 2024-9-25 21:23

大头吃小头 发表于 2024-9-25 21:05
不错了 amd该降价了吧 等着zen4大船

AMD一直不贵。。。批单的EPYC一直低。。。
9654早期那批 多报单项目流出来的 谭里人不是证明过。。。还是有保修的
不过牙膏批单价格也低超微那边还都是牙膏U 就是价格足够低

momo77989724 发表于 2024-9-25 21:24

gihu 发表于 2024-9-25 19:24
拿就64核EPYC打 128核XEON吧。
不过讲真,128核XEON能打过带3D vcache的EPYC,已经很不容易了 ...

牙膏这个缓存也不低。。。我记得6代的缓存是300多一个 2颗也有700来着
后面还要继续堆 大家都堆。。。反正自己厂

HZJ 发表于 2024-9-25 21:29

AMD靠着3D cache和台积电作弊,最终还是被Intel打下阵来

ykdo 发表于 2024-9-25 21:38

wjm47196 发表于 2024-9-25 07:48
zen5出来了比zen4

zen5的EPYC还没出啊[偷笑]

lacsiess 发表于 2024-9-25 21:39

kmdkai 发表于 2024-9-25 09:55
问题是10月ZEN5 EPYC就要出了,某些方面大约能比ZEN4接近翻倍性能,intel如何应对? ...

288C啊......不就是核战吗?

kupanda2021 发表于 2024-9-25 21:39

用户 发表于 2024-9-25 10:27
别说zen5,intel用自家工艺能和zen4拼订单也已经是烧高香了。

intel 3 不比n4p差啊,而且良率算不错的

赫敏 发表于 2024-9-25 21:49

momo77989724 发表于 2024-9-25 08:24
牙膏这个缓存也不低。。。我记得6代的缓存是300多一个 2颗也有700来着
后面还要继续堆 大家都堆。。。反 ...

504MB L3

gihu 发表于 2024-9-26 09:52

momo77989724 发表于 2024-9-25 21:24
牙膏这个缓存也不低。。。我记得6代的缓存是300多一个 2颗也有700来着
后面还要继续堆 大家都堆。。。反 ...

膏厂的服务器级别u差的还不止是cache,总线上也差好多,这次有这么大进步猜想是改良总线了,至少可以和infinite fabric切磋了

默兜 发表于 2024-9-26 11:00

500W。。。。
那不就是128c vs 96c 然后500W vs 400W [偷笑] 还是上一代Zen4
不过相比之下已经进步很大了,之前都是双路干单路,还干不赢

gihu 发表于 2024-9-26 15:19

周喆 发表于 2024-9-25 20:59
9754这么弱,只比9654高了一丁点,看来还是高密度库把频率压的太狠了

zen4c 和zen4还是有差距的

gihu 发表于 2024-9-26 15:22

lacsiess 发表于 2024-9-25 21:39
288C啊......不就是核战吗?

288c记得是144核的atom双 socket,估计 在196核的zen5c面前毫无胜算[偷笑]

Illidan2004 发表于 2024-9-26 15:34

gihu 发表于 2024-9-26 15:22
288c记得是144核的atom双 socket,估计 在196核的zen5c面前毫无胜算

如果有Skymont性能的288C 应该还是很猛的

gihu 发表于 2024-9-26 15:41

Illidan2004 发表于 2024-9-26 15:34
如果有Skymont性能的288C 应该还是很猛的

就算skymont IPC比起zen5c还是差多了,而且算上频率上的差距可能更大

aasa0001 发表于 2024-9-26 15:51

周喆 发表于 2024-9-25 20:59
9754这么弱,只比9654高了一丁点,看来还是高密度库把频率压的太狠了

官方定价已经告诉你了[偷笑]

lacsiess 发表于 2024-9-26 16:50

gihu 发表于 2024-9-26 15:22
288c记得是144核的atom双 socket,估计 在196核的zen5c面前毫无胜算

堆288C的小核,算力不够数量来凑

YsHaNg 发表于 2024-9-26 17:11

lacsiess 发表于 2024-9-26 08:50
堆288C的小核,算力不够数量来凑

然而按功率密度性能比还是会输 大dc还是会用脚选

5d5588cf 发表于 2024-9-26 17:23

gihu 发表于 2024-9-26 09:52
膏厂的服务器级别u差的还不止是cache,总线上也差好多,这次有这么大进步猜想是改良总线了,至少可以和in ...

mesh什么时候比IF差了?IF那套实质multi-ring牙膏又不是没用过,从IVB-EX用到BWD-EP,发现超过20c延迟的问题解决不了才去用mesh的。mesh的问题是频率不如ring好拉,所以从EMR开始堆L3,透过更大的L3去解决L3因为和mesh的频率绑定导致速度上不去的问题。

zhuifeng88 发表于 2024-9-26 17:31

gihu 发表于 2024-9-25 19:24
拿就64核EPYC打 128核XEON吧。
不过讲真,128核XEON能打过带3D vcache的EPYC,已经很不容易了 ...

非共享的cache算总量没意义的...if下remote cache延迟比内存都高, 3d vcache epyc有意义的数值一样是96M

MikuLuka 发表于 2024-9-26 17:46

等AMD祭出EPYX X3D的旗舰型号呗。
AMD的多die封装可以暴力堆核了
而且还不是新款今年ZEN5C ZEN5X3D 一个可以暴力堆核一个可以目标3GL3了

gihu 发表于 2024-9-26 17:48

5d5588cf 发表于 2024-9-26 17:23
mesh什么时候比IF差了?IF那套实质multi-ring牙膏又不是没用过,从IVB-EX用到BWD-EP,发现超过20c延迟的 ...

mesh什么时候比IF强了?IF啥时候变multi-ring了? IF是连接ccd之间以及ccd和IOD之间的总线,ring bus是DIE内部核间通讯的总线,根本不是一回事。
就烦你这种半桶水乱晃的

gihu 发表于 2024-9-26 17:55

zhuifeng88 发表于 2024-9-26 17:31
非共享的cache算总量没意义的...if下remote cache延迟比内存都高, 3d vcache epyc有意义的数值一样是96M ...

算到每个核心,Granite Rapids每个核心也就4M不到的L3,比起EPYC-X的12M,还是差远了。而且Mesh总线一样也无法通吃全部L3,甚至跨区域的核心间通讯效率还不如IF总线。就不知道6代xeon的mesh总线效率是否有所提升

5d5588cf 发表于 2024-9-26 18:17

gihu 发表于 2024-9-26 17:48
mesh什么时候比IF强了?IF啥时候变multi-ring了? IF是连接ccd之间以及ccd和IOD之间的总线,ring bus是DI ...

我说的是IF那套,而不是IF本身。因为我习惯把Intel的system agent当成ring/mesh的其中一部分,没说清楚是我的错。问题在于system agent到ring/mesh的带宽不比IF到ring的表现差。然后IF不是单纯的CCD和I/O die之间的fabric,SDF一样是IF的一部分。

zhuifeng88 发表于 2024-9-26 18:23

本帖最后由 zhuifeng88 于 2024-9-26 18:28 编辑

gihu 发表于 2024-9-26 17:55
算到每个核心,Granite Rapids每个核心也就4M不到的L3,比起EPYC-X的12M,还是差远了。而且Mesh总线一样 ...

不是算平均的, 是算每核心可以没额外penalty访问的范围...
实际性能敏感的任务大都是多个核心协同处理同一个working set, 直接按核心数算平均那是各跑各的...又不是开一堆单核虚拟机用这么算
没额外penalty访问的范围gnr开snc是168M不开snc是完整的504M, 最坏延迟开snc是20-30ns, 不开是30-40ns, epyc是96M, 10-20ns, 出96M立刻上升到100ns以上
另外哪来的跨区域效率mesh不如if, 带宽两头差不多, 最坏情况的l1/l1脏命中是60-80ns对比100-120ns(单socket)

5d5588cf 发表于 2024-9-26 18:46

gihu 发表于 2024-9-26 15:41
就算skymont IPC比起zen5c还是差多了,而且算上频率上的差距可能更大

而且我不知道为什么你会用LNL这种没有L3,uncore还会降频,内存延迟更高,对内存延迟更敏感的Skymont,来推算CWF上有几百MB L3的Darkmont的PPC。LNL上的Skymont的int PPC已经比RPL-P Gracemont这种用JEDEC DDR5的还低,快和Haswell差不多了。然后我也不知道你是基于什么证据认为Turin Dense的频率会高于CWF。同样1W/c的情况下Skymont是3.3GHz,而Zen 5 dense只有2.0GHz。就当LPE Skymont是占了没有L3和ring/mesh agent的便宜好了,假设on-ring版的Skymont L3和ring agent要吃掉0.5w,那么0.5w下的Skymont还是能跑到3.0GHz,而STX上的Zen 5 dense IPC仅仅比一堆debuff的LNL Skymont高了20%。

cx533 发表于 2024-9-26 18:52

别争了,这上面的CPU跟这里99.99999999999999999999999%的人都没关系


momo77989724 发表于 2024-9-26 18:59

cx533 发表于 2024-9-26 18:52
别争了,这上面的CPU跟这里99.99999999999999999999999%的人都没关系

那你有点低估CHH了
闲鱼9654也就1W多一颗。。。在这论坛大概率 一个帖子里有2个人有的

tjmxxo 发表于 2024-9-26 19:39

128打96???

zhuifeng88 发表于 2024-9-26 19:47

tjmxxo 发表于 2024-9-26 19:39
128打96???

坐下, 前代amd96打outel60, 现实不需要讲武德[睡觉]

gihu 发表于 2024-9-26 20:17

5d5588cf 发表于 2024-9-26 18:46
而且我不知道为什么你会用LNL这种没有L3,uncore还会降频,内存延迟更高,对内存延迟更敏感的Skymont,来 ...

你别忘了,zen5c可是有SMT的,144core @2 socket面对的可是384 thread的zen 5c,这个和笔记本上测试单核IPC可不是一回事[偷笑]

gihu 发表于 2024-9-26 20:19

zhuifeng88 发表于 2024-9-26 19:47
坐下, 前代amd96打outel60, 现实不需要讲武德

前代amd 96打outel的可不止是60,60x2照打不误,所以我说granite rapids进步很大
页: 1 [2] 3 4
查看完整版本: 赢!全大核至强6重回性能王座