strix halo大改了CCD互联方式

gartour 发表于 2025-1-16 01:31

本帖最后由 gartour 于 2025-1-16 01:36 编辑

AMD SOC架构师的采访

https://chipsandcheese.com/p/amds-strix-halo-under-the-hood

大意：以前的CCD间通讯要经过数据串行化-传输-去串行化过程，简化了布线，但是增加了延迟和功耗。

strix halo，得益于扇出封装，CCD间通讯直接并行连接，代价跟上面反过来，海量的布线增加，但有更低的延迟和功耗。

BFG9K 发表于 2025-1-16 01:34

其实就是ZEN6会用的新封装，先在Strix Halo上用了

其实STX Halo上的ZEN5 CCD才是完全体，AM5现在的IOD对ZEN4 CCD都是性能限制

银月发表于 2025-1-16 02:00

最大的优势不是统一内存吗，符合时下潮流

就是不知道什么时候这风能吹到独显上

kingofgu 发表于 2025-1-16 02:12

AM5+Pro21这一套看下来应该预留不够
要不amd低头认个错下一代换了顺便把ASmedia踹了外包intel设计下桥片？

tator 发表于 2025-1-16 02:15

kingofgu 发表于 2025-1-16 02:12
AM5+Pro21这一套看下来应该预留不够
要不amd低头认个错下一代换了顺便把ASmedia踹了外包intel设计下桥片 ...

祥硕真的拉中之拉[困惑]刚把我一个想装ryzen但是有3m2需求的朋友劝退了

赫敏发表于 2025-1-16 02:23

倒不如说其实就是RDNA3上的InFo封装，连线变多但是更紧凑
https://cdn.mos.cms.futurecdn.net/zaqGG36rgTNQJz4xjpTWZb-1200-80.jpg
不过这个图里的标识有点问题，错位了。大的这个是organic substrte，右边小的这个是high performance

赫敏发表于 2025-1-16 02:25

kingofgu 发表于 2025-1-15 13:12
AM5+Pro21这一套看下来应该预留不够
要不amd低头认个错下一代换了顺便把ASmedia踹了外包intel设计下桥片 ...

intel的芯片组其实都不赚钱。甚至asmedia这个被人骂了一条街的都算是做慈善，你看其他功能比芯片组单一很多的hub芯片卖多少钱

赫敏发表于 2025-1-16 02:25

不过这个网站的主持人怎么看着这么母0[困惑]

大头吃小头 发表于 2025-1-16 02:38

tator 发表于 2025-1-16 02:15
祥硕真的拉中之拉刚把我一个想装ryzen但是有3m2需求的朋友劝退了

b850现在普遍3m2了吹雪b850 不拆x16可以4个m2……

8xwob3ko 发表于 2025-1-16 02:40

tator 发表于 2025-1-16 02:15
祥硕真的拉中之拉刚把我一个想装ryzen但是有3m2需求的朋友劝退了

3m2为啥劝退，又不是5m2

theworkbench 发表于 2025-1-16 02:40

赫敏发表于 2025-1-16 02:25
不过这个网站的主持人怎么看着这么母0

哈哈哈哈

melancholy05 发表于 2025-1-16 03:15

赫敏发表于 2025-1-16 02:25
不过这个网站的主持人怎么看着这么母0

有一种成都0号“U熊”感[偷笑]

ljy1414 发表于 2025-1-16 03:34

赫敏发表于 2025-1-16 02:25
不过这个网站的主持人怎么看着这么母0

基佬我感觉被冒犯了

[流泪]https://cdn.jsdelivr.net/gh/master-of-forums/master-of-forums/public/images/patch.gif

一日发表于 2025-1-16 04:10

ljy1414 发表于 2025-1-15 11:34
基佬我感觉被冒犯了

湾仔乖乖我们爱你

wwwyj 发表于 2025-1-16 04:29

还真是成都必吃榜

af_x_if 发表于 2025-1-16 08:05

32字节全双工总线不算控制和时钟就是512条线了。

hawie 发表于 2025-1-16 08:28

通信就是这样在反复迭代，当年串行全面替代并行，现在又将并行拎回来，有意思。

rana23 发表于 2025-1-16 08:29

RDNA3也是扇出封装，应该已经很成熟了，希望zen6桌面版能用上，别再祖传铜线互联了。

yoloh 发表于 2025-1-16 08:42

zen6性能提升应该不小

459633561 发表于 2025-1-16 09:12

yoloh 发表于 2025-1-16 08:42
zen6性能提升应该不小

intel：又要被再次一击。。。[困惑]

sinopart 发表于 2025-1-16 09:14

hawie 发表于 2025-1-16 08:28
通信就是这样在反复迭代，当年串行全面替代并行，现在又将并行拎回来，有意思。 ...

当年CHIP制成和PCB工艺都不成熟，并行面临的干扰大。现在工艺成熟了，串行也到了效率上线，只好弄回并行

gladiator 发表于 2025-1-16 09:23

459633561 发表于 2025-1-16 09:12
intel：又要被再次一击。。。

再打真的要上演苏妈那个表情包，什么intel还在做CPU.jpg了

Miner 发表于 2025-1-16 10:04

银月发表于 2025-1-16 02:00
最大的优势不是统一内存吗，符合时下潮流

就是不知道什么时候这风能吹到独显上 ...

感觉很难，而且后面CPU和GPU是竞争关系（LLM本地推理）。

以前CPU对于多数桌面和移动用户性能是过剩的，但是LLM的出现，不够用了。我认为端侧LLM日后会普及到每一台电脑，手机。

本地推理，目前CPU和GPU的计算性能是够的，最大的瓶颈是带宽，存储容量。

GPU 推理，带宽够，但是皮夹克使劲刀显存。而且非游戏用户为了显存去买旗舰卡性价比实在不高（显存也仍然严重不够）

CPU 推理，虽然桌面很容易插满192G内存，但是带宽严重不足。

在本地运行70b参数的LLM，至少要4*2080ti 22G，或者3090*2，4090*2，5090*2，还要量化4位。所以有人基于功耗，体积，可维护性，跑去买了 M2 Ultra 192GB，带宽和内存容量都有。

所以我希望 AMD 能快速提升 Halo 的带宽，目前还是远远不够

FelixIvory 发表于 2025-1-16 10:34

yoloh 发表于 2025-1-16 08:42
zen6性能提升应该不小

现在不是传言12核一个ccd么！

FelixIvory 发表于 2025-1-16 10:37

halo被gpu大大拖累啊。
现在除了大显存，rdna3.5在2025年不就是个电子垃圾。
既定2024年对标4070m还是可以的。
放到现在，价格和性能失衡。
虽然128g会贵上天，32g也不便宜才是问题。

翰墨留香 发表于 2025-1-16 10:51

赫敏发表于 2025-1-16 02:25
intel的芯片组其实都不赚钱。甚至asmedia这个被人骂了一条街的都算是做慈善，你看其他功能比芯片组单一很 ...

那把IOD拿出来当南桥用的情况岂不是要亏掉底裤了

我輩樹である 发表于 2025-1-16 11:05

谬uma终于实现了，但是挂了个核显。

那个叫序列化和反序列化，所有zero copy的架构就是为了取消这个过程。

我輩樹である 发表于 2025-1-16 11:10

在AI 性能方面，得益于Ryzen AI Max+ 395配备了高达50 TOPS的XDNA 2架构NPU，成为了全球首款支持 70B LLM 的 Windows 11 AI+ PC APU，在 LM Studio 中的 AI 性能比 NVIDIA GeForce RTX 4090 高出 2.2 倍，同时功耗降低了87%。

这尼玛太春秋笔法了，70bq4模型4090根本就是几乎不能跑，比几乎不能跑高2.2倍也是不能跑，这时候就不跟mac比了？3d渲染跟mac比，70b大模型跟4090比，你是懂田忌赛马的。

赫敏发表于 2025-1-16 11:13

翰墨留香发表于 2025-1-15 21:51
那把IOD拿出来当南桥用的情况岂不是要亏掉底裤了

是啊，后来就不做了。而且一直在修bug

赫敏发表于 2025-1-16 11:18

459633561 发表于 2025-1-15 20:12
intel：又要被再次一击。。。

没事，只要等到18A，一切都会好起来的

说真的，真希望牢英好起来

页: [1] 2

Chiphell - 分享与交流用户体验's Archiver

strix halo大改了CCD互联方式