找回密码
 加入我们
搜索
      
查看: 7513|回复: 57

[CPU] strix halo大改了CCD互联方式

[复制链接]
发表于 2025-1-16 01:31 | 显示全部楼层 |阅读模式
本帖最后由 gartour 于 2025-1-16 01:36 编辑

AMD SOC架构师的采访

https://chipsandcheese.com/p/amds-strix-halo-under-the-hood


大意:以前的CCD间通讯要经过数据  串行化-传输-去串行化   过程,简化了布线,但是增加了延迟和功耗。

strix halo,得益于扇出封装,CCD间通讯直接并行连接,代价跟上面反过来,海量的布线增加,但有更低的延迟和功耗。

发表于 2025-1-16 01:34 | 显示全部楼层
其实就是ZEN6会用的新封装,先在Strix Halo上用了

其实STX Halo上的ZEN5 CCD才是完全体,AM5现在的IOD对ZEN4 CCD都是性能限制
发表于 2025-1-16 02:00 | 显示全部楼层
最大的优势不是统一内存吗,符合时下潮流

就是不知道什么时候这风能吹到独显上
发表于 2025-1-16 02:12 | 显示全部楼层
AM5+Pro21这一套看下来应该预留不够
要不amd低头认个错 下一代换了 顺便把ASmedia踹了 外包intel设计下桥片?
发表于 2025-1-16 02:15 | 显示全部楼层
kingofgu 发表于 2025-1-16 02:12
AM5+Pro21这一套看下来应该预留不够
要不amd低头认个错 下一代换了 顺便把ASmedia踹了 外包intel设计下桥片 ...

祥硕真的拉中之拉刚把我一个想装ryzen但是有3m2需求的朋友劝退了
发表于 2025-1-16 02:23 | 显示全部楼层
倒不如说其实就是RDNA3上的InFo封装,连线变多但是更紧凑

不过这个图里的标识有点问题,错位了。大的这个是organic substrte,右边小的这个是high performance
发表于 2025-1-16 02:25 | 显示全部楼层
kingofgu 发表于 2025-1-15 13:12
AM5+Pro21这一套看下来应该预留不够
要不amd低头认个错 下一代换了 顺便把ASmedia踹了 外包intel设计下桥片 ...

intel的芯片组其实都不赚钱。甚至asmedia这个被人骂了一条街的都算是做慈善,你看其他功能比芯片组单一很多的hub芯片卖多少钱
发表于 2025-1-16 02:25 | 显示全部楼层
不过这个网站的主持人怎么看着这么母0
发表于 2025-1-16 02:38 来自手机 | 显示全部楼层
tator 发表于 2025-1-16 02:15
祥硕真的拉中之拉刚把我一个想装ryzen但是有3m2需求的朋友劝退了

b850现在普遍3m2了  吹雪b850 不拆x16可以4个m2……
发表于 2025-1-16 02:40 来自手机 | 显示全部楼层
tator 发表于 2025-1-16 02:15
祥硕真的拉中之拉刚把我一个想装ryzen但是有3m2需求的朋友劝退了

3m2为啥劝退,又不是5m2
发表于 2025-1-16 02:40 来自手机 | 显示全部楼层
赫敏 发表于 2025-1-16 02:25
不过这个网站的主持人怎么看着这么母0

哈哈哈哈
发表于 2025-1-16 03:15 | 显示全部楼层
赫敏 发表于 2025-1-16 02:25
不过这个网站的主持人怎么看着这么母0

有一种成都0号“U熊”感
发表于 2025-1-16 03:34 | 显示全部楼层
赫敏 发表于 2025-1-16 02:25
不过这个网站的主持人怎么看着这么母0

基佬我感觉被冒犯了

发表于 2025-1-16 04:10 | 显示全部楼层
ljy1414 发表于 2025-1-15 11:34
基佬我感觉被冒犯了

湾仔乖乖我们爱你
发表于 2025-1-16 04:29 来自手机 | 显示全部楼层
还真是成都必吃榜
发表于 2025-1-16 08:05 来自手机 | 显示全部楼层
32字节全双工总线不算控制和时钟就是512条线了。
发表于 2025-1-16 08:28 | 显示全部楼层
通信就是这样在反复迭代,当年串行全面替代并行,现在又将并行拎回来,有意思。
发表于 2025-1-16 08:29 来自手机 | 显示全部楼层
RDNA3也是扇出封装,应该已经很成熟了,希望zen6桌面版能用上,别再祖传铜线互联了。
发表于 2025-1-16 08:42 | 显示全部楼层
zen6性能提升应该不小
发表于 2025-1-16 09:12 | 显示全部楼层
yoloh 发表于 2025-1-16 08:42
zen6性能提升应该不小

intel:又要被再次一击。。。
发表于 2025-1-16 09:14 | 显示全部楼层
hawie 发表于 2025-1-16 08:28
通信就是这样在反复迭代,当年串行全面替代并行,现在又将并行拎回来,有意思。 ...

当年CHIP制成和PCB工艺都不成熟,并行面临的干扰大。现在工艺成熟了,串行也到了效率上线,只好弄回并行
发表于 2025-1-16 09:23 | 显示全部楼层
459633561 发表于 2025-1-16 09:12
intel:又要被再次一击。。。

再打真的要上演苏妈那个表情包,什么intel还在做CPU.jpg了
发表于 2025-1-16 10:04 | 显示全部楼层
银月 发表于 2025-1-16 02:00
最大的优势不是统一内存吗,符合时下潮流

就是不知道什么时候这风能吹到独显上 ...

感觉很难,而且后面CPU和GPU是竞争关系(LLM本地推理)。

以前CPU对于多数桌面和移动用户性能是过剩的,但是LLM的出现,不够用了。我认为端侧LLM日后会普及到每一台电脑,手机。

本地推理,目前CPU和GPU的计算性能是够的,最大的瓶颈是带宽,存储容量。

GPU 推理,带宽够,但是皮夹克使劲刀显存。而且非游戏用户为了显存去买旗舰卡性价比实在不高(显存也仍然严重不够)

CPU 推理,虽然桌面很容易插满192G内存,但是带宽严重不足。

在本地运行70b参数的LLM,至少要4*2080ti 22G,或者3090*2,4090*2,5090*2,还要量化4位。所以有人基于功耗,体积,可维护性,跑去买了 M2 Ultra 192GB,带宽和内存容量都有。

所以我希望 AMD 能快速提升 Halo 的带宽,目前还是远远不够
发表于 2025-1-16 10:34 | 显示全部楼层
yoloh 发表于 2025-1-16 08:42
zen6性能提升应该不小

现在不是传言12核一个ccd么!
发表于 2025-1-16 10:37 | 显示全部楼层
halo被gpu大大拖累啊。
现在除了大显存,rdna3.5在2025年不就是个电子垃圾。
既定2024年对标4070m还是可以的。
放到现在,价格和性能失衡。
虽然128g会贵上天,32g也不便宜才是问题。
发表于 2025-1-16 10:51 | 显示全部楼层
赫敏 发表于 2025-1-16 02:25
intel的芯片组其实都不赚钱。甚至asmedia这个被人骂了一条街的都算是做慈善,你看其他功能比芯片组单一很 ...

那把IOD拿出来当南桥用的情况岂不是要亏掉底裤了
发表于 2025-1-16 11:05 | 显示全部楼层
谬uma终于实现了,但是挂了个核显。

那个叫序列化和反序列化,所有zero copy的架构就是为了取消这个过程。
发表于 2025-1-16 11:10 | 显示全部楼层
在AI 性能方面,得益于Ryzen AI Max+ 395配备了高达50 TOPS的XDNA 2架构NPU,成为了全球首款支持 70B LLM 的 Windows 11 AI+ PC APU,在 LM Studio 中的 AI 性能比 NVIDIA GeForce RTX 4090 高出 2.2 倍,同时功耗降低了87%。

这尼玛太春秋笔法了,70bq4模型4090根本就是几乎不能跑,比几乎不能跑高2.2倍也是不能跑,这时候就不跟mac比了?3d渲染跟mac比,70b大模型跟4090比,你是懂田忌赛马的。
发表于 2025-1-16 11:13 | 显示全部楼层
翰墨留香 发表于 2025-1-15 21:51
那把IOD拿出来当南桥用的情况岂不是要亏掉底裤了

是啊,后来就不做了。而且一直在修bug
发表于 2025-1-16 11:18 | 显示全部楼层
459633561 发表于 2025-1-15 20:12
intel:又要被再次一击。。。

没事,只要等到18A,一切都会好起来的

说真的,真希望牢英好起来
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-4-26 14:52 , Processed in 0.092507 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表