请教下这个错误是哪个硬件出问题了?
过年期间组了一台All in One小主机,主要拿来跑一些服务软件。全部京东自营购入,处理器为I3-12100,主板MSI Pro B660M-G DDR4,内存用的威刚D50 4133 8GX2(未加载XMP,仅使用默认2666频率)。电源银欣SX650-G,650W的一个ITX电源。Win10 LTSC 2021不装任何软件,全部依赖新建HYper-V虚拟实例运行各类服务。最近发现服务各种不稳定,看日志发现N多类似如下代码为41的错误【2022/9/10 13:15:11 Kernel-Power 41 (63)】,并出现了代码1的WHEA-Logger事件。担心LTSC对12代兼容不好,重装了操作系统,发现Win11无论RTM的21H2还是即将发布的22H2,故障依旧。遂又更换到了Win10 21H2、22H2,故障依旧。此时怀疑硬件问题。
以为是电源GG了,遂更换了XFX、海盗船、TT、以及全汉几个电源试过,故障依旧。
内存更换了HOF的3200 C14,英睿达的C9BZJ 3200 ,海盗船的3200,不加载任何设置,默认频率使用。故障依旧。
SSD更换了NVME/SATA的各种接口盘,三星、金士顿、闪迪、KAIXIA,故障依旧。
只剩主板和处理器因为疫情封控没条件更换了。
想请问下各位,WHEA-Logger 1和41的Kernel-Power,究竟是哪个硬件出问题了?
41仅是非正常重启的记录,1是蓝屏~~~优先查一下CPU,是否AIO导致散热不良 之前论坛有人好像发过一篇很长的文章,是Z690南桥和sata芯片相关的问题,具体记不清了他好像开关aspm和不用某接口后能解决部分问题,帖子可能是看不到了 lacsiess 发表于 2022-9-10 14:11
41仅是非正常重启的记录,1是蓝屏~~~优先查一下CPU,是否AIO导致散热不良
对,我接到显示器上重现了一下,确实是突然一个蓝屏,WHEA_UNCORRECTABLE_ERROR什么的,然后重启。。。因为虚拟机自己会重启后打开。以为只是服务不稳定,没想到是蓝屏重启了。 uuyyhhjj 发表于 2022-9-10 14:25
之前论坛有人好像发过一篇很长的文章,是Z690南桥和sata芯片相关的问题,具体记不清了他好像开关aspm和不用 ...
因为我用的是B660,不确定他的描述是不是适用这个。我刚才去实验了一下,关闭了ASPM,和C-State禁止。然而不幸的是故障依旧。。。 有没有装任何的硬件信息监控比如aida64 或者hwinfo之类的 我是华硕Z690的主板,也是经常WHEA 1报错,之前贴吧有讨论这个问题的,有人WHEA1会伴随无征兆重启,有的人啥也不会发生,如果只有一个41报错估计就是系统直接死机或者黑屏重启了,蓝屏是有记录的,我之前也偶尔冻屏死机,现在发现是AMD显卡驱动的问题,WHQL版和PRO企业版驱动都会随机冻屏死机,但是最新的测试版驱动没问题,装的黑苹果也没问题。
这个WHEA1估计和主板有关,显卡内存换过没用,系统也换过,很迷。 小主机不建议用12代,太热了。您下个温度软件看看,有无哪个东西温度太高 我的两台NUC8也是不规律蓝屏重启,是5月更新核显驱动的问题 你这个太粗略了,windows 有一个windbg 工具,你百度一下使用方法。windows 死机的时候,会dump出一个coro文件。 你用windbg 分析一下, 它最后会有一个分析结果。不会看,你大体看看最后面,会有进程信息。 1 BIOS升级最新。
2 CPU核心电压offset模式+0.05v,内存电压1.4v电它试试。 chacha20 发表于 2022-9-10 17:27
我是华硕Z690的主板,也是经常WHEA 1报错,之前贴吧有讨论这个问题的,有人WHEA1会伴随无征兆重启,有的人 ...
1 BIOS升级最新。
2 CPU核心电压offset模式+0.05v,内存电压1.4v电它试试。
把Pcie节能关了 native power management Windows store装windbg分析c:/windows/Memory.dmp或者minidump/ 你这折腾花了不少时间吧,看着就头大。
蓝屏时有显示错误代码的,拍个照,然后网上搜下。
windows是官网下载然后安装的吧? whea1就是CPU或者内存不稳,简单的方法就是加电压,cpu manual 1.35v,内存一样https://cdn.jsdelivr.net/gh/master-of-forums/master-of-forums/public/images/patch.gif
页:
[1]