找回密码
 加入我们
搜索
      
查看: 397|回复: 2

[显卡] 讨论一下Medusa Point拓展核显

[复制链接]
发表于 2025-6-26 13:27 | 显示全部楼层 |阅读模式
讨论Medusa Point拓展核显,其实还是觉得Medusa Point拓展核显的意义比拓展个12C ZEN6更大

***Medusa Point的规格分析和性能预测
Medusa Point预计还有至少一年才能推出,但现在已经有一些信息:
工艺和封装:TSMC N3P工艺,FP10封装,比FP8稍大
CPU:4*Zen6+4*Zen6c+2*LP-Zen6,预计单核性能比Ryzen AI9 365高15%~25%,多核持平或稍高
GPU:RDNA3.5+ 8CU(支持FSR4),预计稍高于Ryzen AI7 350的核显,AMD核显在2027年之前都是RDNA3.5
AI:>55TOPs
内存支持:128bit LPDDR5X/DDR5(预计可以支持到LPDDR5X-9600)
PCIE:估计是PCIE5.0*20(据说比Strix Point多)

***Medusa Point的拓展性分析
1.Medusa Point最引人注目的功能是它的可拓展性(chiplet支持),目前已知可以拓展一个12C ZEN6的CCD。
2.Medusa Point SOC和CCD使用的是高级封装,类似Strix Halo和Navi31/32,D2D使用的是并行接口,总带宽达到200G以上应该没问题,延迟相较之前的Serdes要低很多。
3.Medusa Point的Chiplet D2D接口大概率是AMD自己的协议,理论上可以和AMD使用同种协议的CPU、GPU、NPU、FPGA、以太网PHY等集成其他IP的芯片互联,从而实现功能或性能的拓展,如果使用的是UCIe协议(小概率,但AMD也是UCIe的发起者),还可以拓展其他公司的芯片。
4. ZEN6 12C CCD使用TSMC N2工艺,面积据说75mm2。考虑到TSMC N2芯片平均密度大约比TSMC N4P高约45~50%,ZEN5 CCD面积约70mm2,所以预估ZEN6 CCD实际面积约80~90mm2,所以芯片面积如果不超过90mm2,和Medusa Point封装在一起应该没问题。

***Medusa Point拓展GPU的规格和性能分析
1.RDNA3.5+ GPU 20CU & 16M Mall Cache(AMD核显在2027年之前都是RDNA3.5)
(1) 根据Strix Halo的面积推算,RDNA3.5+ GPU 20CU & 16M Mall Cache,加上D2D的互联端口后的芯片(没有Media Engine、PCIE、Display Engine),在TSMC N4P下约100mm2,在TSMC N3P下约77mm2,封装没问题
(2) RDNA3.5+ GPU 20CU & 16M Mall Cache,规格是Strix Halo的一半,Mall Cache可以减小IO带宽需求,如果GPU功耗给到60W,达到Strix Halo的60%性能应该没问题,大约TS 6600
(3) 理论上拓展的RDNA3.5+ 20CU GPU可以和集成的RDNA3.5+ 8CU GPU融合,但这样无论是芯片硬件架构设计还是软件优化,成本都比较高。

2. UDNA GPU 16CU & 16M Mall Cache(2027年及以后才有可能)
(1) TSMC N3P下90mm2以内的芯片集成这个规格大概率可以,封装没问题
(2) RDNA4的GPU前端架构大改,降低了显存带宽的需求,UDNA还会在GPU前端架构方面继续优化
(3) 新架构的能效比理论上比RDNA3.5+要高一些,光追和AI性能提升巨大
(4) 拓展的UDNA GPU大概率不能和集成的RDNA3.5+ 8CU GPU融合

Medusa Point拓展12C

Medusa Point拓展12C
 楼主| 发表于 2025-6-26 13:47 | 显示全部楼层
目前对于核显,瓶颈主要在于内存带宽和功耗。
对于R7 8845HS、AI9 HX370,由于使用的LPDDR5X频率不高(最高7500MT),且功耗限制在25W左右,所以性能上不去。
解决方法主要在三个方面:
1.提高内存带宽,可以提高内存频率,但这会增加PCB板成本,或者增加内存位宽(Strix Halo)
2.减小GPU带宽需求,可以从GPU前端架构优化(RDNA4)、加入Mall Cache(Strix Halo)这两个方面
3.提高GPU功耗,需要增加供电和散热规格

Strix Halo的RDNA3.5 40CU GPU,加入32M Mall Cache,使用256bit LPDDR5X-8000,在迷你主机上,功耗拉到120W,直接来到了TS 11000。

对于Medusa Point拓展GPU:
1.内存还是128bit LPDDR5X,带宽提升不大
2.减小GPU带宽需求,在拓展GPU芯片中加入Mall Cache没问题,如果使用UDNA,更好的前端设计可以提高内存效率
3.Medusa Point拓展12C ZEN6 CCD,那么拓展芯片的供电肯定没问题,给拓展GPU 60W功耗是可以的,更何况工艺会比Strix Halo的更先进

所以RDNA3.5+ 20CU & 16M Mall Cache的拓展GPU,性能达到Strix Halo的60%性能应该没问题
 楼主| 发表于 2025-6-26 14:01 | 显示全部楼层
Medusa Point拓展12C ZEN6 CCD,产品线预计是Ryzen AI 9甚至Ryzen AI Max,定位是高端轻薄本、移动工作站。理论上多核性能可以超过R9 9950X(不考虑功耗),但这对普通用户来说,性能远远溢出了。当然如果给12C ZEN6 CCD再加一个3D缓存,可以给游戏本用,但Medusa Ridge(HX55)也能支持3D缓存,而且更适合游戏本。
但如果给Medusa Point拓展GPU,GPU功耗给到60W,性能可以达到60W的RTX3060M甚至RTX4050M、RTX5050M,这对普通用户来说还是很利好的,无论是成本、体积都要比独立显卡要低。
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-6-27 01:47 , Processed in 0.008575 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表