momo77989724
发表于 2024-9-25 21:23
大头吃小头 发表于 2024-9-25 21:05
不错了 amd该降价了吧 等着zen4大船
AMD一直不贵。。。批单的EPYC一直低。。。
9654早期那批 多报单项目流出来的 谭里人不是证明过。。。还是有保修的
不过牙膏批单价格也低超微那边还都是牙膏U 就是价格足够低
momo77989724
发表于 2024-9-25 21:24
gihu 发表于 2024-9-25 19:24
拿就64核EPYC打 128核XEON吧。
不过讲真,128核XEON能打过带3D vcache的EPYC,已经很不容易了 ...
牙膏这个缓存也不低。。。我记得6代的缓存是300多一个 2颗也有700来着
后面还要继续堆 大家都堆。。。反正自己厂
HZJ
发表于 2024-9-25 21:29
AMD靠着3D cache和台积电作弊,最终还是被Intel打下阵来
ykdo
发表于 2024-9-25 21:38
wjm47196 发表于 2024-9-25 07:48
zen5出来了比zen4
zen5的EPYC还没出啊[偷笑]
lacsiess
发表于 2024-9-25 21:39
kmdkai 发表于 2024-9-25 09:55
问题是10月ZEN5 EPYC就要出了,某些方面大约能比ZEN4接近翻倍性能,intel如何应对? ...
288C啊......不就是核战吗?
kupanda2021
发表于 2024-9-25 21:39
用户 发表于 2024-9-25 10:27
别说zen5,intel用自家工艺能和zen4拼订单也已经是烧高香了。
intel 3 不比n4p差啊,而且良率算不错的
赫敏
发表于 2024-9-25 21:49
momo77989724 发表于 2024-9-25 08:24
牙膏这个缓存也不低。。。我记得6代的缓存是300多一个 2颗也有700来着
后面还要继续堆 大家都堆。。。反 ...
504MB L3
gihu
发表于 2024-9-26 09:52
momo77989724 发表于 2024-9-25 21:24
牙膏这个缓存也不低。。。我记得6代的缓存是300多一个 2颗也有700来着
后面还要继续堆 大家都堆。。。反 ...
膏厂的服务器级别u差的还不止是cache,总线上也差好多,这次有这么大进步猜想是改良总线了,至少可以和infinite fabric切磋了
默兜
发表于 2024-9-26 11:00
500W。。。。
那不就是128c vs 96c 然后500W vs 400W [偷笑] 还是上一代Zen4
不过相比之下已经进步很大了,之前都是双路干单路,还干不赢
gihu
发表于 2024-9-26 15:19
周喆 发表于 2024-9-25 20:59
9754这么弱,只比9654高了一丁点,看来还是高密度库把频率压的太狠了
zen4c 和zen4还是有差距的
gihu
发表于 2024-9-26 15:22
lacsiess 发表于 2024-9-25 21:39
288C啊......不就是核战吗?
288c记得是144核的atom双 socket,估计 在196核的zen5c面前毫无胜算[偷笑]
Illidan2004
发表于 2024-9-26 15:34
gihu 发表于 2024-9-26 15:22
288c记得是144核的atom双 socket,估计 在196核的zen5c面前毫无胜算
如果有Skymont性能的288C 应该还是很猛的
gihu
发表于 2024-9-26 15:41
Illidan2004 发表于 2024-9-26 15:34
如果有Skymont性能的288C 应该还是很猛的
就算skymont IPC比起zen5c还是差多了,而且算上频率上的差距可能更大
aasa0001
发表于 2024-9-26 15:51
周喆 发表于 2024-9-25 20:59
9754这么弱,只比9654高了一丁点,看来还是高密度库把频率压的太狠了
官方定价已经告诉你了[偷笑]
lacsiess
发表于 2024-9-26 16:50
gihu 发表于 2024-9-26 15:22
288c记得是144核的atom双 socket,估计 在196核的zen5c面前毫无胜算
堆288C的小核,算力不够数量来凑
YsHaNg
发表于 2024-9-26 17:11
lacsiess 发表于 2024-9-26 08:50
堆288C的小核,算力不够数量来凑
然而按功率密度性能比还是会输 大dc还是会用脚选
5d5588cf
发表于 2024-9-26 17:23
gihu 发表于 2024-9-26 09:52
膏厂的服务器级别u差的还不止是cache,总线上也差好多,这次有这么大进步猜想是改良总线了,至少可以和in ...
mesh什么时候比IF差了?IF那套实质multi-ring牙膏又不是没用过,从IVB-EX用到BWD-EP,发现超过20c延迟的问题解决不了才去用mesh的。mesh的问题是频率不如ring好拉,所以从EMR开始堆L3,透过更大的L3去解决L3因为和mesh的频率绑定导致速度上不去的问题。
zhuifeng88
发表于 2024-9-26 17:31
gihu 发表于 2024-9-25 19:24
拿就64核EPYC打 128核XEON吧。
不过讲真,128核XEON能打过带3D vcache的EPYC,已经很不容易了 ...
非共享的cache算总量没意义的...if下remote cache延迟比内存都高, 3d vcache epyc有意义的数值一样是96M
MikuLuka
发表于 2024-9-26 17:46
等AMD祭出EPYX X3D的旗舰型号呗。
AMD的多die封装可以暴力堆核了
而且还不是新款今年ZEN5C ZEN5X3D 一个可以暴力堆核一个可以目标3GL3了
gihu
发表于 2024-9-26 17:48
5d5588cf 发表于 2024-9-26 17:23
mesh什么时候比IF差了?IF那套实质multi-ring牙膏又不是没用过,从IVB-EX用到BWD-EP,发现超过20c延迟的 ...
mesh什么时候比IF强了?IF啥时候变multi-ring了? IF是连接ccd之间以及ccd和IOD之间的总线,ring bus是DIE内部核间通讯的总线,根本不是一回事。
就烦你这种半桶水乱晃的
gihu
发表于 2024-9-26 17:55
zhuifeng88 发表于 2024-9-26 17:31
非共享的cache算总量没意义的...if下remote cache延迟比内存都高, 3d vcache epyc有意义的数值一样是96M ...
算到每个核心,Granite Rapids每个核心也就4M不到的L3,比起EPYC-X的12M,还是差远了。而且Mesh总线一样也无法通吃全部L3,甚至跨区域的核心间通讯效率还不如IF总线。就不知道6代xeon的mesh总线效率是否有所提升
5d5588cf
发表于 2024-9-26 18:17
gihu 发表于 2024-9-26 17:48
mesh什么时候比IF强了?IF啥时候变multi-ring了? IF是连接ccd之间以及ccd和IOD之间的总线,ring bus是DI ...
我说的是IF那套,而不是IF本身。因为我习惯把Intel的system agent当成ring/mesh的其中一部分,没说清楚是我的错。问题在于system agent到ring/mesh的带宽不比IF到ring的表现差。然后IF不是单纯的CCD和I/O die之间的fabric,SDF一样是IF的一部分。
zhuifeng88
发表于 2024-9-26 18:23
本帖最后由 zhuifeng88 于 2024-9-26 18:28 编辑
gihu 发表于 2024-9-26 17:55
算到每个核心,Granite Rapids每个核心也就4M不到的L3,比起EPYC-X的12M,还是差远了。而且Mesh总线一样 ...
不是算平均的, 是算每核心可以没额外penalty访问的范围...
实际性能敏感的任务大都是多个核心协同处理同一个working set, 直接按核心数算平均那是各跑各的...又不是开一堆单核虚拟机用这么算
没额外penalty访问的范围gnr开snc是168M不开snc是完整的504M, 最坏延迟开snc是20-30ns, 不开是30-40ns, epyc是96M, 10-20ns, 出96M立刻上升到100ns以上
另外哪来的跨区域效率mesh不如if, 带宽两头差不多, 最坏情况的l1/l1脏命中是60-80ns对比100-120ns(单socket)
5d5588cf
发表于 2024-9-26 18:46
gihu 发表于 2024-9-26 15:41
就算skymont IPC比起zen5c还是差多了,而且算上频率上的差距可能更大
而且我不知道为什么你会用LNL这种没有L3,uncore还会降频,内存延迟更高,对内存延迟更敏感的Skymont,来推算CWF上有几百MB L3的Darkmont的PPC。LNL上的Skymont的int PPC已经比RPL-P Gracemont这种用JEDEC DDR5的还低,快和Haswell差不多了。然后我也不知道你是基于什么证据认为Turin Dense的频率会高于CWF。同样1W/c的情况下Skymont是3.3GHz,而Zen 5 dense只有2.0GHz。就当LPE Skymont是占了没有L3和ring/mesh agent的便宜好了,假设on-ring版的Skymont L3和ring agent要吃掉0.5w,那么0.5w下的Skymont还是能跑到3.0GHz,而STX上的Zen 5 dense IPC仅仅比一堆debuff的LNL Skymont高了20%。
cx533
发表于 2024-9-26 18:52
别争了,这上面的CPU跟这里99.99999999999999999999999%的人都没关系
momo77989724
发表于 2024-9-26 18:59
cx533 发表于 2024-9-26 18:52
别争了,这上面的CPU跟这里99.99999999999999999999999%的人都没关系
那你有点低估CHH了
闲鱼9654也就1W多一颗。。。在这论坛大概率 一个帖子里有2个人有的
tjmxxo
发表于 2024-9-26 19:39
128打96???
zhuifeng88
发表于 2024-9-26 19:47
tjmxxo 发表于 2024-9-26 19:39
128打96???
坐下, 前代amd96打outel60, 现实不需要讲武德[睡觉]
gihu
发表于 2024-9-26 20:17
5d5588cf 发表于 2024-9-26 18:46
而且我不知道为什么你会用LNL这种没有L3,uncore还会降频,内存延迟更高,对内存延迟更敏感的Skymont,来 ...
你别忘了,zen5c可是有SMT的,144core @2 socket面对的可是384 thread的zen 5c,这个和笔记本上测试单核IPC可不是一回事[偷笑]
gihu
发表于 2024-9-26 20:19
zhuifeng88 发表于 2024-9-26 19:47
坐下, 前代amd96打outel60, 现实不需要讲武德
前代amd 96打outel的可不止是60,60x2照打不误,所以我说granite rapids进步很大