讨论一下Medusa Point拓展核显

新加坡妖王 · 发表于 2025-6-26 13:27

讨论Medusa Point拓展核显，其实还是觉得Medusa Point拓展核显的意义比拓展个12C ZEN6更大

***Medusa Point的规格分析和性能预测
Medusa Point预计还有至少一年才能推出，但现在已经有一些信息：
工艺和封装：TSMC N3P工艺，FP10封装，比FP8稍大
CPU：4*Zen6+4*Zen6c+2*LP-Zen6，预计单核性能比Ryzen AI9 365高15%~25%，多核持平或稍高
GPU：RDNA3.5+ 8CU（支持FSR4），预计稍高于Ryzen AI7 350的核显，AMD核显在2027年之前都是RDNA3.5
AI：>55TOPs
内存支持：128bit LPDDR5X/DDR5（预计可以支持到LPDDR5X-9600）
PCIE：估计是PCIE5.0*20（据说比Strix Point多）

***Medusa Point的拓展性分析
1.Medusa Point最引人注目的功能是它的可拓展性（chiplet支持），目前已知可以拓展一个12C ZEN6的CCD。
2.Medusa Point SOC和CCD使用的是高级封装，类似Strix Halo和Navi31/32，D2D使用的是并行接口，总带宽达到200G以上应该没问题，延迟相较之前的Serdes要低很多。
3.Medusa Point的Chiplet D2D接口大概率是AMD自己的协议，理论上可以和AMD使用同种协议的CPU、GPU、NPU、FPGA、以太网PHY等集成其他IP的芯片互联，从而实现功能或性能的拓展，如果使用的是UCIe协议（小概率，但AMD也是UCIe的发起者），还可以拓展其他公司的芯片。
4. ZEN6 12C CCD使用TSMC N2工艺，面积据说75mm2。考虑到TSMC N2芯片平均密度大约比TSMC N4P高约45~50%，ZEN5 CCD面积约70mm2，所以预估ZEN6 CCD实际面积约80~90mm2，所以芯片面积如果不超过90mm2，和Medusa Point封装在一起应该没问题。

***Medusa Point拓展GPU的规格和性能分析
1.RDNA3.5+ GPU 20CU & 16M Mall Cache（AMD核显在2027年之前都是RDNA3.5）
(1) 根据Strix Halo的面积推算，RDNA3.5+ GPU 20CU & 16M Mall Cache，加上D2D的互联端口后的芯片（没有Media Engine、PCIE、Display Engine），在TSMC N4P下约100mm2，在TSMC N3P下约77mm2，封装没问题
(2) RDNA3.5+ GPU 20CU & 16M Mall Cache，规格是Strix Halo的一半，Mall Cache可以减小IO带宽需求，如果GPU功耗给到60W，达到Strix Halo的60%性能应该没问题，大约TS 6600
(3) 理论上拓展的RDNA3.5+ 20CU GPU可以和集成的RDNA3.5+ 8CU GPU融合，但这样无论是芯片硬件架构设计还是软件优化，成本都比较高。

2. UDNA GPU 16CU & 16M Mall Cache（2027年及以后才有可能）
(1) TSMC N3P下90mm2以内的芯片集成这个规格大概率可以，封装没问题
(2) RDNA4的GPU前端架构大改，降低了显存带宽的需求，UDNA还会在GPU前端架构方面继续优化
(3) 新架构的能效比理论上比RDNA3.5+要高一些，光追和AI性能提升巨大
(4) 拓展的UDNA GPU大概率不能和集成的RDNA3.5+ 8CU GPU融合

新加坡妖王 · 发表于 2025-6-26 13:47

目前对于核显，瓶颈主要在于内存带宽和功耗。
对于R7 8845HS、AI9 HX370，由于使用的LPDDR5X频率不高（最高7500MT），且功耗限制在25W左右，所以性能上不去。
解决方法主要在三个方面：
1.提高内存带宽，可以提高内存频率，但这会增加PCB板成本，或者增加内存位宽（Strix Halo）
2.减小GPU带宽需求，可以从GPU前端架构优化（RDNA4）、加入Mall Cache（Strix Halo）这两个方面
3.提高GPU功耗，需要增加供电和散热规格

Strix Halo的RDNA3.5 40CU GPU，加入32M Mall Cache，使用256bit LPDDR5X-8000，在迷你主机上，功耗拉到120W，直接来到了TS 11000。

对于Medusa Point拓展GPU：
1.内存还是128bit LPDDR5X，带宽提升不大
2.减小GPU带宽需求，在拓展GPU芯片中加入Mall Cache没问题，如果使用UDNA，更好的前端设计可以提高内存效率
3.Medusa Point拓展12C ZEN6 CCD，那么拓展芯片的供电肯定没问题，给拓展GPU 60W功耗是可以的，更何况工艺会比Strix Halo的更先进

所以RDNA3.5+ 20CU & 16M Mall Cache的拓展GPU，性能达到Strix Halo的60%性能应该没问题

新加坡妖王 · 发表于 2025-6-26 14:01

Medusa Point拓展12C ZEN6 CCD，产品线预计是Ryzen AI 9甚至Ryzen AI Max，定位是高端轻薄本、移动工作站。理论上多核性能可以超过R9 9950X（不考虑功耗），但这对普通用户来说，性能远远溢出了。当然如果给12C ZEN6 CCD再加一个3D缓存，可以给游戏本用，但Medusa Ridge（HX55）也能支持3D缓存，而且更适合游戏本。
但如果给Medusa Point拓展GPU，GPU功耗给到60W，性能可以达到60W的RTX3060M甚至RTX4050M、RTX5050M，这对普通用户来说还是很利好的，无论是成本、体积都要比独立显卡要低。

账号		自动登录	找回密码
密码			加入我们

[显卡] 讨论一下Medusa Point拓展核显

浏览过的版块