Chiphell - 分享与交流用户体验

标题: Gamers Nexus发布AMD7000系处理器烧毁测试第一期视频 [打印本页]

作者: KingLu    时间: 2023-4-30 13:17
标题: Gamers Nexus发布AMD7000系处理器烧毁测试第一期视频
本帖最后由 KingLu 于 2023-5-3 16:48 编辑

更新了华硕1410版的测试版BIOS,SOC电压下降了0.1V左右,之前是1.3XV,现在是1.2XV。

内存依然开启了EXPO,6000C30也没什么问题。

1410BETA

(, 下载次数: 63)

1101正式版

(, 下载次数: 54)



地址:https://www.youtube.com/watch?v=kiTngvvD5dI

省流总结:




视频中展示了GN和AMD团队关于此次事件的往来邮件,其中一封AMD于4月27日回复GN的邮件如下,省流总结:请更新最新版本的BIOS。

(, 下载次数: 51)
作者: ShireCiel    时间: 2023-4-30 13:19
有没有大佬看完视频解读推测一下到底是为啥烧得。
作者: 幻瓅月    时间: 2023-4-30 13:20
看看有没有复现过程预防一下
作者: KingLu    时间: 2023-4-30 13:28
ShireCiel 发表于 2023-4-30 13:19
有没有大佬看完视频解读推测一下到底是为啥烧得。
These are complex issues with functionally infinite variables between users (and possible error), manufacturers, BIOS versions, and AMD itself. As such, we can only speak to our findings in some instances -- but we have some that do point to specific issues.


关于烧毁问题,GN当前给出的答复如上,简单来讲就是在用户、厂商、BIOS版本和AMD本身*存在无限多的变量*,因此目前只能具体案例具体分析。
作者: nApoleon    时间: 2023-4-30 13:33
怎么都不可能只是一个单纯电压高的问题,因为如果只是电压高就会烧,而且其实也就高了这么点,那人人都可以进入BIOS里设置一下某个BIOS里电压参数结果就是boom,但实际上并不会.
我认为,但凡BIOS里能提供的电压参数,首先第一能提供设置的电压参数范围都是安全的,其次任何不安全的参数修改都不应该烧毁U,因为必然存在检测系统来防止这样的事情发生.
作者: qdzx123    时间: 2023-4-30 13:35
那么更新bios后是否可以复现?
作者: KingLu    时间: 2023-4-30 13:40
nApoleon 发表于 2023-4-30 13:33
怎么都不可能只是一个单纯电压高的问题,因为如果只是电压高就会烧,而且其实也就高了这么点,那人人都可以进 ...

确实,但是目前的解决方案似乎就是限制了SoC,因为这个看起来最好“欺负”,不知道会不会召回。
作者: Cyberpangk    时间: 2023-4-30 13:42
(, 下载次数: 48)


作者: csnb    时间: 2023-4-30 13:46
本帖最后由 csnb 于 2023-4-30 19:15 编辑

友商开大绝招了

Been waiting for this: Thanks GNl! Happened to me last weekend: 795x3D.EXPO emabled.3 das after ibuit Pc heard a pop from mobo and PC went dead. Tumns out CPU and MsMag x670e mobo were fiedRMA was approved and 1 was back up and runing the next day. Tupdated to a new BlOs yesterday sol should be good to go: My frst AMD build since theAthlon XP 1800+ in 2001.. and it's a beast! 4090 with 64GB 6000mhz CL30!
机翻:
一直在等这个!谢谢GN!!!上周末发生在我身上!7950x3D...EXPO启用...在我组装完PC的3天后,我听到主板的爆裂声,PC死机了。原来CPU和微星Mag x670e 主板被炸了。RMA 获得批准,第二天我又恢复了运行。我昨天更新到一个新的 BIOS,所以我应该很高兴!自 1800 年 Athlon XP 2001+ 以来,我的第一个 AMD 版本......而且是野兽!4090 与 64GB 6000MHz CL30!
MSI也存在烧毁的案例,这波御三家都凑齐了,AMD背大锅。


视频已搬运
https://www.bilibili.com/video/BV1TL411e76x/

作者: dens    时间: 2023-4-30 13:53
不是单SOC问题,那就变复杂了啊。
作者: 点此更新    时间: 2023-4-30 13:56
KingLu 发表于 2023-4-30 13:40
确实,但是目前的解决方案似乎就是限制了SoC,因为这个看起来最好“欺负”,不知道会不会召回。 ...

我想起来以前SM961也有温度过高的问题
三星的解决办法就是一个限制读写速度的固件来降低这个 温度过高 的问题.........
作者: ts02147823    时间: 2023-4-30 14:03
本帖最后由 ts02147823 于 2023-4-30 14:10 编辑

等新版 AGESA 1.0.0.7


HKEPC

【 AMD 补镬🔥】针对 Ryzen 7000X3D CPU 烧燬事件,AMD 紧急释出了 AGESA 1.0.0.7 韧体来救命,据主机板厂商透露,它并非单纯将 SOC 电压限制在不超过 1.3V 水平,同时修改了 PROCHOT Control 与 ‘PROCHOT Deassertion Ramp Time 两个热安全相关的机制,所以 7000X3D 用家务必尽快更至 AGESA 1.0.0.7 的 BIOS

据了解,PROCHOT Control 是与 CBS 和 SMU_COMMON 相关的函数,它是一种热安全功能,用于防止处理器过热,当处理器的温度达到临界值时,CPU 或其他系统组件会发送 PROCHOT 信号,处理器随即降低功率以降低温度并防止可能的损坏。
PROCHOT Deassertion Ramp Time 是处理器当 PROCHOT 过热讯号发生后,再次回復正常功率的时间定义。当温度回落到临界值以下时,处理器逐渐增加其功率并返回正常工作条件所需的时间间距。

AGESA 1.0.0.7 明显对于 PROCHOT 的定义变得保守,PROCHOT 与 SOC / IMC 相关的电压与温度临界值会大幅降低,同时功耗回復的间距时间会变长,意味着这次 CPU 烧燬事件并非单一原因,一方面是过高的 SOC 电压,加上不完善的热管理构成,不过能否真正解决问题还需时间考証。
各大主机板厂暂时发佈的应急 BIOS 是基于 AGESA 1.0.0.6,只是单纯地限制了 SOC 电压,所以 1.0.0.7 才是 AMD 官方解决方案,AMD 已向主机板厂商提供了 BETA 版本作内测用途,暂定 5 月 6 日提供正式版本
作者: T.JOHN    时间: 2023-4-30 14:12
ts02147823 发表于 2023-4-30 14:03
等新版 AGESA 1.0.0.7



这个才比较靠谱,和toms的新闻里root cause热管理一致,没有cpu内部逻辑处理的更新都是治标不治本的方案。asus电压给了高加速了烧毁触发并提高了烧毁概率,toppc lin则更是不屑于解释。
作者: AIAO    时间: 2023-4-30 14:46
把视频看完了,总结一下Gamers Nexus的说法:

1. 主要原因是VSOC过高,导致CPU几百度的高温烧毁;

2. VSOC跟EXPO无关,全看板厂的设定;

3. AMD的问题:没有跟板厂沟通好,尤其是安全的电压范围;

4. 华硕的问题:为了内存的兼容性,VSOC给的远高于正常范围;

5. 华硕的问题:主板的OCP形同虚设(否则在炸U的时候可以保护主板);

6. 某嘉的问题:有一个bug,导致没有加载默认或用户输入的VSOC;

7. 华硕主板的VDDIO电压加载也不对(但好像跟烧毁无关),AMD或华硕背锅;

8. AMD对CPU保修(即使开EXPO),但不清楚各板厂是否承诺保修主板。
作者: inSeek    时间: 2023-4-30 14:59
nApoleon 发表于 2023-4-30 13:33
怎么都不可能只是一个单纯电压高的问题,因为如果只是电压高就会烧,而且其实也就高了这么点,那人人都可以进 ...

我在ASUS X99-E WS上曾遇到过,某次启动进bios看到CPU跑在1.7v,都紫红色了。
因为温度也不对,所以应该不是电压误读... 但这个问题我后面就没再复现过了。

所以检测系统可能没有,或者非常弱,或者本身就有bug,或者本身就是罪魁祸首...
作者: inSeek    时间: 2023-4-30 15:00
AIAO 发表于 2023-4-30 14:46
把视频看完了,总结一下Gamers Nexus的说法:

1. 主要原因是VSOC过高,导致CPU几百度的高温烧毁;

确实....
ASUS X670EE,SOC和VDDIO的实际电压全往1.4-1.45v去了
作者: T.JOHN    时间: 2023-4-30 15:01
本帖最后由 T.JOHN 于 2023-4-30 15:29 编辑

一些超频玩家感兴趣的事实
1. igpu不止从SOC取电,还从vcore取电
2. SOC电压部分会跑进CCD

电路图(中间那张图来自于板厂)


失效图


部分硅渣问题。大致意思是由于少数晶体体质或封装不佳,auto下可能给出超出工程师预计很高的电压,但这些电流流不过去,仍然不足供给满足soc工作的电流,导致额外发热。对于AMD来说这种问题由于存在不同工艺节点的soc和ccd和封装,很难在QA/QC环节中发现。加上主板BIOS的QC,难免有漏网之鱼。


各家板厂SOC电压对比(不过这不重要,反正AMD把锅背好了,其他人都是次责)


EXPO的profile不涉及SOC电压,SOC电压是板厂给的,内存厂商不背锅

如果你在打人的主板上,内存超频蓝屏了,可能是启用了内置AMD菜单中后,VDDIO电压给低了

作者: bennisdy    时间: 2023-4-30 15:11
提示: 作者被禁止或删除 内容自动屏蔽
作者: gbawrc    时间: 2023-4-30 15:32
提示: 作者被禁止或删除 内容自动屏蔽
作者: AIAO    时间: 2023-4-30 15:37
gbawrc 发表于 2023-4-30 15:32
问题1:一颗品控合格的CPU,为什么会出现几百度的高温,CPU里那么多传感器检测不到温度异常?检测到温度 ...

几百度是在烧毁的时候。之前是由于过高的VSOC(同时影响IOD和CCD),加速硅的老化。具体原理可能要等第二期视频了。
作者: los_parrot    时间: 2023-4-30 15:55
我没听错的话,GN说的是cpu电压过高短路,返回00信号,但华硕的主板没有重置电压,而是继续往socket上灌电流,直到cpu的焊接点融化。cpu本身在烧毁前就已经死机了,主板没能正确识别,继续供电。




作者: inSeek    时间: 2023-4-30 15:59
T.JOHN 发表于 2023-4-30 15:01
一些超频玩家感兴趣的事实
1. igpu不止从SOC取电,还从vcore取电
2. SOC电压部分会跑进CCD

GN视频里有出现的X670EE,确实就是EXPO开启后AUTO=1.35v,实际负载时会跑到1.42v...
我裂开... 我今天就遇到了一次奇怪的突然黑屏重启....emmmm...
作者: katoslixon    时间: 2023-4-30 16:00
gbawrc 发表于 2023-4-30 15:32
问题1:一颗品控合格的CPU,为什么会出现几百度的高温,CPU里那么多传感器检测不到温度异常?检测到温度 ...

这应该不关生产品控的事,是产品设计出了问题,厂商在调试主板BIOS的时候也没有做相关的考虑和测试。
作者: wujiwu    时间: 2023-4-30 16:02
msi躲过一劫?
作者: katoslixon    时间: 2023-4-30 16:02
这波不得召回?不在硬件底层加以限制,而直接限制最高电压,那岂不是白白限制性能,喂用户shit?而且看上边几位兄弟总结,似乎不仅仅是电压问题,那新AGESA下去又有tweaker搞炸了硬件谁还买zen4?
作者: inSeek    时间: 2023-4-30 16:03
我比较关心的是,最新bios下会不会性能缩水...
作者: 掩不住的锋芒    时间: 2023-4-30 16:05
提示: 作者被禁止或删除 内容自动屏蔽
作者: nApoleon    时间: 2023-4-30 16:07
掩不住的锋芒 发表于 2023-4-30 16:05
华硕电压远高于友商,这锅背不背…不知之前的卵子还切不? 还是先挂着 ...

高这点就烧U我觉得但凡有点阅历的玩家都很清楚这不可能发生的...
作者: texnis    时间: 2023-4-30 16:11
温度管理为什么不起作用,会不会是设计/制造工艺瑕疵,导致供电通路存在电阻过高的瑕疵热点,会慢慢积累发热烧蚀,过高的SOC电压会加速这个过程,最后彻底爆发烧毁,而温度监控一般在CPU核心区域,监控不到问题所在区域
作者: los_parrot    时间: 2023-4-30 16:12
简单描述:cpu过热死机后,主板重启上电的过程中沿用了bios设定中超高的soc电压,叠加上启动状态下cpu会加载最大电流来保证启动顺利(cpu启动基本流程)。

然后由于soc有多个不同的供电域,设计上来说都是互相隔离,单独接地的。但是芯片制程演化到现在的阶段,所有芯片都会有漏电流,导致高压的供电域的电流往低压(正常电压)区域流动堆积大量热能。


作者: rich0428    时间: 2023-4-30 16:20
影片内简单就分2点
1.CPU怎么死的
2.CPU死掉后主板在干什么

肇责该怎么切越来越明显
作者: AIAO    时间: 2023-4-30 16:22
接着我上面的总结,我依然认为这次就是单纯的华硕和某嘉主板VSOC的问题。按照GN的说法,这次VSOC已经高的很离谱了,当然也可以不认同GN的观点。

AMD的问题在于没有给出电压限制,也没有和板厂交流好,华硕在于给的VSOC太离谱,某嘉在于有bug。至于GN提到的其它问题,如OCP、温度墙等,跟烧CPU应该没有直接关系,前者反映华硕自己的问题,后者反映AMD跟板厂的沟通问题。

至于微星主板,好像至今没有爆出相关问题。已知的案例无非是CPU正常损坏(哪有不坏的CPU型号),或是友商泼脏水(常见套路了,只有评论,没有图片,也没打算将板U寄给GN)。如果我说的有问题请指正。

未来BIOS对性能应该是没有影响的,参考现在微星主板的性能。当然也不排除AGESA 1.0.0.7过于保守,FLCK有所影响,不过正常开EXPO问题不大。
作者: yoloh    时间: 2023-4-30 16:26
本帖最后由 yoloh 于 2023-4-30 16:29 编辑

烧的案例就这么几例就让召回?这有什么法律根据吗?

作者: gbawrc    时间: 2023-4-30 16:28
提示: 作者被禁止或删除 内容自动屏蔽
作者: los_parrot    时间: 2023-4-30 16:35
gbawrc 发表于 2023-4-30 16:28
CPU都死了主板还在持续输出猛艹

是过热重启了,然后在重启流程中全力供电,配合soc电压。
作者: gbawrc    时间: 2023-4-30 16:42
提示: 作者被禁止或删除 内容自动屏蔽
作者: mdk2000    时间: 2023-4-30 16:50
要是出个病毒起名amd yes,恶意调高电压,怕不是要火
作者: panzerlied    时间: 2023-4-30 17:17
我说EXPO是背锅的吧,发帖说的不好听就不愿意看咯?
华硕这波Auto劲儿够大,非常enjoy,,没有上不去的参数只有你不敢电。然后触发了一个超频过热失败后的死循环,你超不上去继续电,这里主要是大电流。

X3D默电太低,电流相对就大,欧姆定律。
作者: panzerlied    时间: 2023-4-30 17:20
T.JOHN 发表于 2023-4-30 15:01
一些超频玩家感兴趣的事实
1. igpu不止从SOC取电,还从vcore取电
2. SOC电压部分会跑进CCD

打人家真的是一枝独秀。
作者: panzerlied    时间: 2023-4-30 17:24
农企还是速度修了后把目光放到Zen5X3D吧,没有那么好的能耗比供你挥霍了。
作者: lh4357    时间: 2023-4-30 17:30
按照他们的说法,不是电压给高了导致的物理烧毁。

而是CPU先被高电压整坏了并短路以后,还继续尝试通电导致高发热。 (, 下载次数: 35)

真-电热丝。
作者: weizhen199    时间: 2023-4-30 17:41
lh4357 发表于 2023-4-30 17:30
按照他们的说法,不是电压给高了导致的物理烧毁。

而是CPU先被高电压整坏了并短路以后,还继续尝试通电导 ...


电流上不去啊教练。
rog教练:直到最后一刻也不能放弃希望,一旦心死了的话,真正的比赛就结束了。
于是x3d变成了光

真庆幸我一直定压1.35v
作者: BFG9K    时间: 2023-4-30 17:53
关于SOC电压这块,GN用量表直插主板,不用BIOS和软件数,看ASUS X670E HERO 板子的SOC电压

BIOS版本从0922,1101到烧U事件爆发前的所有BIOS都测过,所以SOC电压高是通病,并不是某些人推测的那样只有0922会烧

(, 下载次数: 37)

读出的电压在1.40V上下,远高于AMD的1.30上限值,1.25推荐值

GN评论ASUS的SOC电压' way too high'

GN认为ASUS给这么高的SOC电压是lazyness,纯粹偷懒为了保证最好的内存兼容性,才给SOC打了这么高的电压

(, 下载次数: 44)

GN顺便对比了别的牌子的SOC电压,还是ASUS的SOC电压过高

GN说了EXPO是对烧U没有任何责任的


作者: ckloop    时间: 2023-4-30 18:02
本帖最后由 ckloop 于 2023-4-30 18:06 编辑

看了
简单说就是>1.3, CPU有机会被电死没错
但ASUS HERO 板手动入1.35实际给出1.41v !
电死之後, 主板OCP也没有作动导致不停短路才加热到200度boom
作者: nApoleon    时间: 2023-4-30 18:16
BFG9K 发表于 2023-4-30 17:53
关于SOC电压这块,GN用量表直插主板,不用BIOS和软件数,看ASUS X670E HERO 板子的SOC电压

BIOS版本从0922 ...

ASUS责任多少都有了…
作者: Cyberpangk    时间: 2023-4-30 18:40
我比板厂工程师还懂的出现了
作者: lh4357    时间: 2023-4-30 18:47
BFG9K 发表于 2023-4-30 17:53
关于SOC电压这块,GN用量表直插主板,不用BIOS和软件数,看ASUS X670E HERO 板子的SOC电压

BIOS版本从0922 ...

(, 下载次数: 45) MEG MORTAR可还行。
作者: PolyMorph    时间: 2023-4-30 18:53
本帖最后由 PolyMorph 于 2023-4-30 19:05 编辑

电压击穿的部位电阻值变大,传感器没有检测到,保护机制没有触发继续给电流,温度就狂飙了

作者: los_parrot    时间: 2023-4-30 18:54
这代iodie是tsmc 6nm,就是7nm改良版工艺。

大家都知道zen2,zen3电压超过1.35v会发生什么。


作者: panzerlied    时间: 2023-4-30 18:55
想想Zen4X3D日常就大概跑1v,整体能耗比很好,X3D能抗的电压不高,所以总功耗不可能太大,不然电流就太大了,想大都不行的。
作者: ykdo    时间: 2023-4-30 18:56
inSeek 发表于 2023-4-30 14:59
我在ASUS X99-E WS上曾遇到过,某次启动进bios看到CPU跑在1.7v,都紫红色了。
因为温度也不对,所以应该 ...

这么变态的吗
作者: panzerlied    时间: 2023-4-30 18:58
ykdo 发表于 2023-4-30 18:56
这么变态的吗

按华硕的逻辑,红色比紫红色更高。
作者: ra2999    时间: 2023-4-30 19:07
enjoy,不是一家人不进一家门
作者: lh4357    时间: 2023-4-30 19:10
los_parrot 发表于 2023-4-30 18:54
这代iodie是tsmc 6nm,就是7nm改良版工艺。

大家都知道zen2,zen3电压超过1.35v会发生什么。


(, 下载次数: 43)


ZEN2 ZEN3,除了X3D以外,核心电压超过1.35不是日常么。

作者: mobie997    时间: 2023-4-30 19:26
lh4357 发表于 2023-4-30 19:10
ZEN2 ZEN3,除了X3D以外,核心电压超过1.35不是日常么。

SOC 電壓 不是核心
一般都在1.15左右
作者: lh4357    时间: 2023-4-30 19:32
mobie997 发表于 2023-4-30 19:26
SOC 電壓 不是核心
一般都在1.15左右

这次炸U事件还真就是3D缓存部分不耐压导致的。
如果是IOD不耐压,前面发售的非3D早就该炸了一大片了,等不到现在。
作者: sunrise12sh    时间: 2023-4-30 19:33
5900X SOC电压我只给了1.125V就能稳了,低于1。1V会蓝屏。现在ZEN4的SOC电压这么高听吗
作者: ydjj    时间: 2023-4-30 19:38
lh4357 发表于 2023-4-30 19:32
这次炸U事件还真就是3D缓存部分不耐压导致的。
如果是IOD不耐压,前面发售的非3D早就该炸了一大片了,等 ...


一切责任全在INTEL和NV

台积电 ←NEW!
作者: mobie997    时间: 2023-4-30 19:42
lh4357 发表于 2023-4-30 19:32
这次炸U事件还真就是3D缓存部分不耐压导致的。
如果是IOD不耐压,前面发售的非3D早就该炸了一大片了,等 ...

對我看錯了
以前用5900X 就 定頻1.18V 4500
58X3D -30 最高看到是1.21左右
作者: inSeek    时间: 2023-4-30 21:08
BFG9K 发表于 2023-4-30 17:53
关于SOC电压这块,GN用量表直插主板,不用BIOS和软件数,看ASUS X670E HERO 板子的SOC电压

BIOS版本从0922 ...

ASUS的主板就是在基础值上再加0.05-0.06v

EXPO 1.35v,实际1.41v,设置1.45v,实际1.51v...
作者: 掩不住的锋芒    时间: 2023-4-30 21:08
提示: 作者被禁止或删除 内容自动屏蔽
作者: nApoleon    时间: 2023-4-30 22:06
掩不住的锋芒 发表于 2023-4-30 21:08
意思是华硕电压远高于友商你认,但你觉得1.5之于1.3高出的0.2不是问题主要还是AMD U的问题? ...

高这点能导致烧U?你起码得有基础的理解能力…不然你比找别人战,我没空陪你~
作者: 掩不住的锋芒    时间: 2023-4-30 22:15
提示: 作者被禁止或删除 内容自动屏蔽
作者: 掩不住的锋芒    时间: 2023-4-30 22:22
提示: 作者被禁止或删除 内容自动屏蔽
作者: 掩不住的锋芒    时间: 2023-4-30 22:26
提示: 作者被禁止或删除 内容自动屏蔽
作者: 掩不住的锋芒    时间: 2023-4-30 22:38
提示: 作者被禁止或删除 内容自动屏蔽
作者: jwlili    时间: 2023-5-1 01:05
以前林大出的视频有过专门的介绍,就是某品牌的电压显示的和实际的不一样。现在果然出问题了




欢迎光临 Chiphell - 分享与交流用户体验 (https://www.chiphell.com/) Powered by Discuz! X3.5