linsen775 发表于 2022-9-10 14:09

请教下这个错误是哪个硬件出问题了?

过年期间组了一台All in One小主机,主要拿来跑一些服务软件。全部京东自营购入,处理器为I3-12100,主板MSI Pro B660M-G DDR4,内存用的威刚D50 4133 8GX2(未加载XMP,仅使用默认2666频率)。电源银欣SX650-G,650W的一个ITX电源。Win10 LTSC 2021不装任何软件,全部依赖新建HYper-V虚拟实例运行各类服务。最近发现服务各种不稳定,看日志发现N多类似如下代码为41的错误【2022/9/10 13:15:11        Kernel-Power        41        (63)】,并出现了代码1的WHEA-Logger事件。




担心LTSC对12代兼容不好,重装了操作系统,发现Win11无论RTM的21H2还是即将发布的22H2,故障依旧。遂又更换到了Win10 21H2、22H2,故障依旧。此时怀疑硬件问题。

以为是电源GG了,遂更换了XFX、海盗船、TT、以及全汉几个电源试过,故障依旧。
内存更换了HOF的3200 C14,英睿达的C9BZJ 3200 ,海盗船的3200,不加载任何设置,默认频率使用。故障依旧。
SSD更换了NVME/SATA的各种接口盘,三星、金士顿、闪迪、KAIXIA,故障依旧。
只剩主板和处理器因为疫情封控没条件更换了。

想请问下各位,WHEA-Logger 1和41的Kernel-Power,究竟是哪个硬件出问题了?






lacsiess 发表于 2022-9-10 14:11

41仅是非正常重启的记录,1是蓝屏~~~优先查一下CPU,是否AIO导致散热不良

uuyyhhjj 发表于 2022-9-10 14:25

之前论坛有人好像发过一篇很长的文章,是Z690南桥和sata芯片相关的问题,具体记不清了他好像开关aspm和不用某接口后能解决部分问题,帖子可能是看不到了

linsen775 发表于 2022-9-10 14:36

lacsiess 发表于 2022-9-10 14:11
41仅是非正常重启的记录,1是蓝屏~~~优先查一下CPU,是否AIO导致散热不良

对,我接到显示器上重现了一下,确实是突然一个蓝屏,WHEA_UNCORRECTABLE_ERROR什么的,然后重启。。。因为虚拟机自己会重启后打开。以为只是服务不稳定,没想到是蓝屏重启了。

linsen775 发表于 2022-9-10 14:38

uuyyhhjj 发表于 2022-9-10 14:25
之前论坛有人好像发过一篇很长的文章,是Z690南桥和sata芯片相关的问题,具体记不清了他好像开关aspm和不用 ...

因为我用的是B660,不确定他的描述是不是适用这个。我刚才去实验了一下,关闭了ASPM,和C-State禁止。然而不幸的是故障依旧。。。

leverkusen 发表于 2022-9-10 15:48

有没有装任何的硬件信息监控比如aida64 或者hwinfo之类的

chacha20 发表于 2022-9-10 17:27

我是华硕Z690的主板,也是经常WHEA 1报错,之前贴吧有讨论这个问题的,有人WHEA1会伴随无征兆重启,有的人啥也不会发生,如果只有一个41报错估计就是系统直接死机或者黑屏重启了,蓝屏是有记录的,我之前也偶尔冻屏死机,现在发现是AMD显卡驱动的问题,WHQL版和PRO企业版驱动都会随机冻屏死机,但是最新的测试版驱动没问题,装的黑苹果也没问题。


这个WHEA1估计和主板有关,显卡内存换过没用,系统也换过,很迷。

mrhjzhang 发表于 2022-9-10 19:57

小主机不建议用12代,太热了。您下个温度软件看看,有无哪个东西温度太高

dedededede 发表于 2022-9-10 21:29

我的两台NUC8也是不规律蓝屏重启,是5月更新核显驱动的问题

paterhai 发表于 2022-9-11 07:16

你这个太粗略了,windows 有一个windbg 工具,你百度一下使用方法。windows 死机的时候,会dump出一个coro文件。 你用windbg 分析一下, 它最后会有一个分析结果。不会看,你大体看看最后面,会有进程信息。

litel 发表于 2022-9-11 14:58

1 BIOS升级最新。
2 CPU核心电压offset模式+0.05v,内存电压1.4v电它试试。

litel 发表于 2022-9-11 14:59

chacha20 发表于 2022-9-10 17:27
我是华硕Z690的主板,也是经常WHEA 1报错,之前贴吧有讨论这个问题的,有人WHEA1会伴随无征兆重启,有的人 ...

1 BIOS升级最新。
2 CPU核心电压offset模式+0.05v,内存电压1.4v电它试试。

andy0449 发表于 2022-9-11 15:02

把Pcie节能关了 native power management

YsHaNg 发表于 2022-9-11 18:36

Windows store装windbg分析c:/windows/Memory.dmp或者minidump/

fkpwolf 发表于 2022-9-11 19:08

你这折腾花了不少时间吧,看着就头大。

蓝屏时有显示错误代码的,拍个照,然后网上搜下。

windows是官网下载然后安装的吧?

T.JOHN 发表于 2022-9-11 19:12

whea1就是CPU或者内存不稳,简单的方法就是加电压,cpu manual 1.35v,内存一样https://cdn.jsdelivr.net/gh/master-of-forums/master-of-forums/public/images/patch.gif
页: [1]
查看完整版本: 请教下这个错误是哪个硬件出问题了?