strix halo大改了CCD互联方式
本帖最后由 gartour 于 2025-1-16 01:36 编辑AMD SOC架构师的采访
https://chipsandcheese.com/p/amds-strix-halo-under-the-hood
大意:以前的CCD间通讯要经过数据串行化-传输-去串行化 过程,简化了布线,但是增加了延迟和功耗。
strix halo,得益于扇出封装,CCD间通讯直接并行连接,代价跟上面反过来,海量的布线增加,但有更低的延迟和功耗。
其实就是ZEN6会用的新封装,先在Strix Halo上用了
其实STX Halo上的ZEN5 CCD才是完全体,AM5现在的IOD对ZEN4 CCD都是性能限制 最大的优势不是统一内存吗,符合时下潮流
就是不知道什么时候这风能吹到独显上 AM5+Pro21这一套看下来应该预留不够
要不amd低头认个错 下一代换了 顺便把ASmedia踹了 外包intel设计下桥片? kingofgu 发表于 2025-1-16 02:12
AM5+Pro21这一套看下来应该预留不够
要不amd低头认个错 下一代换了 顺便把ASmedia踹了 外包intel设计下桥片 ...
祥硕真的拉中之拉[困惑]刚把我一个想装ryzen但是有3m2需求的朋友劝退了 倒不如说其实就是RDNA3上的InFo封装,连线变多但是更紧凑
https://cdn.mos.cms.futurecdn.net/zaqGG36rgTNQJz4xjpTWZb-1200-80.jpg
不过这个图里的标识有点问题,错位了。大的这个是organic substrte,右边小的这个是high performance kingofgu 发表于 2025-1-15 13:12
AM5+Pro21这一套看下来应该预留不够
要不amd低头认个错 下一代换了 顺便把ASmedia踹了 外包intel设计下桥片 ...
intel的芯片组其实都不赚钱。甚至asmedia这个被人骂了一条街的都算是做慈善,你看其他功能比芯片组单一很多的hub芯片卖多少钱 不过这个网站的主持人怎么看着这么母0[困惑] tator 发表于 2025-1-16 02:15
祥硕真的拉中之拉刚把我一个想装ryzen但是有3m2需求的朋友劝退了
b850现在普遍3m2了吹雪b850 不拆x16可以4个m2…… tator 发表于 2025-1-16 02:15
祥硕真的拉中之拉刚把我一个想装ryzen但是有3m2需求的朋友劝退了
3m2为啥劝退,又不是5m2 赫敏 发表于 2025-1-16 02:25
不过这个网站的主持人怎么看着这么母0
哈哈哈哈 赫敏 发表于 2025-1-16 02:25
不过这个网站的主持人怎么看着这么母0
有一种成都0号“U熊”感[偷笑] 赫敏 发表于 2025-1-16 02:25
不过这个网站的主持人怎么看着这么母0
基佬我感觉被冒犯了
[流泪]https://cdn.jsdelivr.net/gh/master-of-forums/master-of-forums/public/images/patch.gif ljy1414 发表于 2025-1-15 11:34
基佬我感觉被冒犯了
湾仔乖乖我们爱你 还真是成都必吃榜 32字节全双工总线不算控制和时钟就是512条线了。 通信就是这样在反复迭代,当年串行全面替代并行,现在又将并行拎回来,有意思。 RDNA3也是扇出封装,应该已经很成熟了,希望zen6桌面版能用上,别再祖传铜线互联了。 zen6性能提升应该不小 yoloh 发表于 2025-1-16 08:42
zen6性能提升应该不小
intel:又要被再次一击。。。[困惑] hawie 发表于 2025-1-16 08:28
通信就是这样在反复迭代,当年串行全面替代并行,现在又将并行拎回来,有意思。 ...
当年CHIP制成和PCB工艺都不成熟,并行面临的干扰大。现在工艺成熟了,串行也到了效率上线,只好弄回并行 459633561 发表于 2025-1-16 09:12
intel:又要被再次一击。。。
再打真的要上演苏妈那个表情包,什么intel还在做CPU.jpg了 银月 发表于 2025-1-16 02:00
最大的优势不是统一内存吗,符合时下潮流
就是不知道什么时候这风能吹到独显上 ...
感觉很难,而且后面CPU和GPU是竞争关系(LLM本地推理)。
以前CPU对于多数桌面和移动用户性能是过剩的,但是LLM的出现,不够用了。我认为端侧LLM日后会普及到每一台电脑,手机。
本地推理,目前CPU和GPU的计算性能是够的,最大的瓶颈是带宽,存储容量。
GPU 推理,带宽够,但是皮夹克使劲刀显存。而且非游戏用户为了显存去买旗舰卡性价比实在不高(显存也仍然严重不够)
CPU 推理,虽然桌面很容易插满192G内存,但是带宽严重不足。
在本地运行70b参数的LLM,至少要4*2080ti 22G,或者3090*2,4090*2,5090*2,还要量化4位。所以有人基于功耗,体积,可维护性,跑去买了 M2 Ultra 192GB,带宽和内存容量都有。
所以我希望 AMD 能快速提升 Halo 的带宽,目前还是远远不够 yoloh 发表于 2025-1-16 08:42
zen6性能提升应该不小
现在不是传言12核一个ccd么! halo被gpu大大拖累啊。
现在除了大显存,rdna3.5在2025年不就是个电子垃圾。
既定2024年对标4070m还是可以的。
放到现在,价格和性能失衡。
虽然128g会贵上天,32g也不便宜才是问题。 赫敏 发表于 2025-1-16 02:25
intel的芯片组其实都不赚钱。甚至asmedia这个被人骂了一条街的都算是做慈善,你看其他功能比芯片组单一很 ...
那把IOD拿出来当南桥用的情况岂不是要亏掉底裤了 谬uma终于实现了,但是挂了个核显。
那个叫序列化和反序列化,所有zero copy的架构就是为了取消这个过程。 在AI 性能方面,得益于Ryzen AI Max+ 395配备了高达50 TOPS的XDNA 2架构NPU,成为了全球首款支持 70B LLM 的 Windows 11 AI+ PC APU,在 LM Studio 中的 AI 性能比 NVIDIA GeForce RTX 4090 高出 2.2 倍,同时功耗降低了87%。
这尼玛太春秋笔法了,70bq4模型4090根本就是几乎不能跑,比几乎不能跑高2.2倍也是不能跑,这时候就不跟mac比了?3d渲染跟mac比,70b大模型跟4090比,你是懂田忌赛马的。 翰墨留香 发表于 2025-1-15 21:51
那把IOD拿出来当南桥用的情况岂不是要亏掉底裤了
是啊,后来就不做了。而且一直在修bug 459633561 发表于 2025-1-15 20:12
intel:又要被再次一击。。。
没事,只要等到18A,一切都会好起来的
说真的,真希望牢英好起来
页:
[1]
2