9953的IMC,确实存在"更考验耐热"一说
本帖最后由 sinopart 于 2025-4-1 13:44 编辑本坛坛友发的贴子已经很多人看过了,他的表述比较激进,让很多人以为他表述的意思是”大部分9953不能稳定开启8000 EXPO“。
我拿我手上这颗9953的折腾经历来说一下吧,刚好这是一颗非常好的能说明983和9953在内存超频上的区别的例子。
平台:X870E Godlike BIOS:1A30;七彩虹 影 6400 C28 OC至8400C36;采用一体式 360 水冷
这颗9953刚拿到手我就用微星的预设参数开8400,失败,才想起来VDDP没动。VDDP是DRAM 模拟传输层的电压,AMD Agesa自动管理下这个电压在超过7600mhz频率后就不会在动,而是维持1.05v。
手动改1.15V VDDP(安全区间<=1.25v),顺利开机,烧MT 200%一把过,毕竟预设参数时序很宽松。打开Y-Cruncher,开始跑VT3子项,”啪“ ,只坚持了1分钟就报错。检查内存温度,不高,检查内存带宽情况,跑MT时读取在70GB/s,而测试VT3时读写只有32GB/,显然VT3对内存压力较小,问题不在内存上。
但IMC也是内存系统的一部分,如果MT那么大的数据量,IMC都能撑住,而VT3却报错了,问题在哪呢?
答案很明显,温度。我马上开始检测MT和VT3下的IOD热点温度,但事实让我傻了眼:IOD温度很正常,VT3下甚至比MT的温度还要低一点。这又是怎么回事?
仔细观察MT和VT3下CPU各个部位负载,我发现VT3除了对内存有大量读写,还有很高的核心负载率,由于VT3调用的是AVX512指令集,这颗9953在运行VT3测试时有着185w的功耗,CPU CCD温度也在70度左右。遂怀疑报错出在核心,于是运行了SVT(Small In-Cache VT3),对核心施加压力,发现不报错,说明跑VT3时的负载尚在核心可承受的范围。
既不是核心问题,也不是内存控制器的问题,那问题在哪?我尝试BIOS拉高风扇转速,发现VT3能多坚持几分钟才出错,这意味着温度这个因素才是关键,但又是哪里的温度不对呢?
其实,很多不了解AMD CPU架构的用户,比如从Intel切换过来的,他们并不知道:AMD的IMC应该分为两部分,第一部份和Intel类似,就是位于IOD上的内存控制器(MC),而第二部分是IOD到CCD之间的通讯线路,这个叫Infinite Fabric(IF总线)。
在AMD CPU中,内存的数据传输过程是这样的:内存上的数据,先通过内存IO 和主板布线传入IOD的MC,MC再通过IOD内部互联总线传入IOD的GMI收发器上。这个GMI收发器是IF总线的物理层,由于IF总线走PCB传输,面临很大的干扰,AMD不得不先将集成电路内部的数据从并行的形式转换成串行的形式去传输,再用一些模拟电路加强IF总线传输线路,这一套东西就是GMI收发器。GMI收发器再将串行化的内存数据通过IF传输到CCD上的GMI收发器,CCD GMI收发器解码为原本的并行数据,发送进L3缓存转给对应的CPU核心。
由于包含大量的模拟电路和一个复杂的并/串型数据互转器,这玩意的功耗并不低,各位用户可以用HWINFO查看CPU功耗部分,会发现除了核心功率,SOC功率,还有一个核心+SOC+MISC功率,这个MISC功率一算在待机下都接近10w,这就是GMI和PCIE PHY部分的耗电,也是AMD待机30w的原因所在(还有一个soc功耗)。
回到我这颗处理器上,在排除了核心错误和MC过热的可能后,我开始怀疑起是CCD和IOD上的GMI收发器在高温下无法承受。由于IOD温度并不高,我认为是CCD上的GMI收发器不耐温。尝试更换硅脂为九州风神DM9,VT3能坚持的时间增长到了3-4分钟,但还是不能坚持到我个人的10分钟标准。还有什么办法?那只有拉低VDDG电压了,这是GMI的供电电压,低电压能带来更低的GMI自发热,也许能改善一下,很多AMD新手都不知道。从默认的1.05拉低到CCD VDDG 0.9,IOD VDDG 0.95,终于解决问题,VT3顺利通过15分钟测试(懒得继续测了)。
最后再回到我们的标题上。为什么在983上,FCLK可以轻松2200,2133,而在9953上,FCLK想稳定就这么难?由于前面讲到的AMD的这种CCD结构,9953因为双CCD要比983多一个GMI收发器,因此对MC的压力也就多了一分,双倍的CCD发热量会让GMI收发器耐热能力直线下降。同时多一组GMI收发器,体质变量就多一份,更容易买到雷的CPU(FCLK不能分CCD设置,必须两个CCD统一FCLK,因此容易出现某个雷CCD上的GMI拖累整套IF总线的频率)。
希望我的这篇帖子能帮助到更多AMD OC玩家。
最直接的, 不拉外频, 核心高于 50℃ 就跑不满 57.5/59.5. 这个影响比折腾那点 if/内存大多了. 开都能开,不耐热,严格一点的标准跑不了mt 太有技术含量了,怒顶,那个坛友虽然语气激进了点,但是看到他每代都测几十颗时就肃然起敬了,这就是热爱吧,虽然我是全auto玩的[傻笑] [可爱] 我想起来 我抄的猫头大佬作业,vddg 俩个都 改成了0.85 膜拜大佬,看完帖子我要再试试我的983能不能稳8400去,因为一直没改vddp电压 本帖最后由 momoka 于 2025-4-1 14:14 编辑
主持实测和感谢科普[可爱]
想起我的丐板B650M和7700,只能跑7800收参,但是8000放宽参数也不亮,是不是也可以改改vddp。。。。[生病] VDDG0.95V以上耐温就很差了,如果体质不行给到1V一般也没啥提升 牛逼,有理有据学习了 momoka 发表于 2025-4-1 14:04
主持实测和感谢科普
想起我的丐板B650M和7700,只能跑7800收参,但是8000放宽参数也不亮,是不是也可以改 ...
VDDP只能解决DDR5 PHY的体质问题
如果瓶颈在主板,上8000就很困难就要摸VDDQ和ODT 所以还是得 落后封装 的 infinity Fabric总线结构 来背锅,承担所有。降VDDG电压 保平安 那说明9950X3D的温度墙更为激进。 哦,我竟然看懂了 受益良多 学习了 楼主的结论存在矛盾,如果是因为CCD 上面的GMI收发器不耐热,那么9950x3d和9800x3d应该不存在区别才对,因为CCD 上只启用了一个GMI收发器,不管单CCD 还是双CCD发热都是一样的,反而双CCD的IOD倒是更热。 插眼 回家摸一下VDDP VDDG darkness66201 发表于 2025-4-1 15:16
楼主的结论存在矛盾,如果是因为CCD 上面的GMI收发器不耐热,那么9950x3d和9800x3d应该不存在区别才对,因 ...
你错误的认为ccd的发热不会对另一个ccd上的gmi产生影响 难怪上次我跑测试报错 想加vddg看看(0.95v→1v),结果从跑测试报错变成了跑测试直接黑屏[偷笑] 昨晚试了下,最多在70度出头坚持10轮。晚上试试楼主的降压。 其实也好理解,双CCD的内存效能比单CCD高,单CCD受限于只有单侧IF,copy上限只有70G带宽,双CCD上限140G,自然跑测的时候压力大很多 我降vddg跑mt 沒多久就藍頻 有人知道為什麼嗎
只有mt會 tm5 karhuyc 都不會 学到了-感谢大佬-虽然我的只是9700x,但是至少知道了 ioc里面的imc还有if总线的关系了 9953关CCD1呢? 有趣,我去调一调CCD VDDG 和 IOD VDDG,
yc哪像测试对这个电压最敏感?就是VT3么? 感谢科普和实测 楼主讲解很细致啊。原来VDDG是干这的,鹅且可以降低。 VDDG CCD IOD这俩能最低多少? 得看FCLK频率吧,大概记得技嘉主板有个推荐范围,好像是2200的话不少于0.95V,2000的话不少于0.85V,具体根据体质略有变化应该 2个改成900mv,应该是有效
页:
[1]
2