我自横刀 发表于 2025-5-18 20:41

近期频繁出现奇怪的4e蓝屏,一度以为内存坏了,最后发现是显卡驱动问题

四月底突然出现蓝屏,最频繁的时候一天三四次

Windbg分析了dmp文件,错误代码4E,基本都指向内存

*******************************************************************************
*                                                                           *
*                        Bugcheck Analysis                                    *
*                                                                           *
*******************************************************************************

PFN_LIST_CORRUPT (4e)
Typically caused by drivers passing bad memory descriptor lists (ie: calling
MmUnlockPages twice with the same list, etc).If a kernel debugger is
available get the stack trace.
Arguments:
Arg1: 0000000000000006, The hardware PTE and/or the prototype PTE PFN data structures have
        been corrupted.
Arg2: 0000000001331b2a, The page frame number
Arg3: ffff810302b57520, The prototype PTE
Arg4: e401480d26180460, The prototype PTE contents

BUGCHECK_CODE:4e
BUGCHECK_P1: 6
BUGCHECK_P2: 1331b2a
BUGCHECK_P3: ffff810302b57520
BUGCHECK_P4: e401480d26180460

FILE_IN_CAB:051425-21593-01.dmp
DUMP_FILE_ATTRIBUTES: 0x21008
Kernel Generated Triage Dump

FAULTING_THREAD:ffffe401707e60c0
BLACKBOXBSD: 1 (!blackboxbsd)
BLACKBOXNTFS: 1 (!blackboxntfs)
BLACKBOXPNP: 1 (!blackboxpnp)
BLACKBOXWINLOGON: 1
CUSTOMER_CRASH_COUNT:1

PROCESS_NAME:typeperf.exe
SYMBOL_NAME:nt!MiDecrementShareCountEx+405
MODULE_NAME: nt
IMAGE_VERSION:10.0.26100.4061
STACK_COMMAND:.process /r /p 0xffffe4016c5760c0; .thread 0xffffe401707e60c0 ; kb
IMAGE_NAME:ntkrnlmp.exe
BUCKET_ID_FUNC_OFFSET:405
FAILURE_BUCKET_ID:0x4E_6_nt!MiDecrementShareCountEx
OSPLATFORM_TYPE:x64
OSNAME:Windows 10


升级最新BIOS——无效
PC硬件拆了重新装一遍——无效
取消所有PBO、内存EXPO设置,跑出厂默认——无效
删除最近更新的windows更新包——无效

准备重装系统前瞄了一眼最近驱动,发现4月底AMD更新了一版25.5.1的驱动。。。。

DDU,退回老驱动,四五天过去了,没有再蓝屏过,难怪说要禁用自动更新驱动啊

我自横刀 发表于 2025-5-18 21:20

我甚至京东又下单了一对金百达的条子

今天刚刚退货(因为故障解决了,所以新内存未拆封)

DUIM 发表于 2025-5-18 21:10

我N卡更新驱动,每天第一次开机就蓝屏
以上退回一年前的驱动才解决

celen_leon 发表于 2025-5-18 21:32

我遇到的AMD的问题更离奇(我已经验证过)。
夏天气温高时,室温30~32℃。电脑睡眠后有概率唤不醒,直接卡CPU灯。长按电源键重启都无效,得清BIOS,且按键清都不好使,得扣电池。
怀疑是膨胀系数之类作祟,试过减小或增加扣具压力或刷别的版本BIOS等手段,均无效。
23年618换7950+X670E-A,在7月底8月初遇到这问题,去年也是最热时遇到这问题,今年拭目以待了[雷人]

Phil_Libra 发表于 2025-5-18 21:36

我魔兽世界一直显存溢出然后卡顿……以前6900XT没遇到过,现在16G显存不够用了

ssyypdc 发表于 2025-5-19 23:13

Phil_Libra 发表于 2025-5-18 21:36
我魔兽世界一直显存溢出然后卡顿……以前6900XT没遇到过,现在16G显存不够用了 ...

啊??魔兽世界吃显存??你确定排查了其他方面吗??

r147909 发表于 2025-5-19 23:23

Phil_Libra 发表于 2025-5-18 21:36
我魔兽世界一直显存溢出然后卡顿……以前6900XT没遇到过,现在16G显存不够用了 ...

把AFMF关了试一下

goat 发表于 2025-5-19 23:27

显卡驱动/浏览器这种动不动更新的玩意儿,曾经干活一半蓝屏的梦魇

U艇 发表于 2025-5-19 23:43

celen_leon 发表于 2025-5-18 21:32
我遇到的AMD的问题更离奇(我已经验证过)。
夏天气温高时,室温30~32℃。电脑睡眠后有概率唤不醒,直接卡C ...

我的电脑是在夏天买的,然后出问题都是在冬天[偷笑]

Phil_Libra 发表于 2025-5-20 11:08

r147909 发表于 2025-5-19 23:23
把AFMF关了试一下

关了,即使不开AA还能吃13G左右,不过溢出的情况好多了

xcdry 发表于 2025-5-20 11:12

去年换了显示器更新了驱动开始每天不固定蓝屏至少一次,更新显卡固件,降级稳定驱动以后稳定陈每天开机一次蓝屏之后就稳定,所以上个月底换了显卡,终于解决了蓝屏问题。。。不过偶尔有闪黑屏,这显卡驱动是越做越烂了

我自横刀 发表于 2025-5-20 11:23

xcdry 发表于 2025-5-20 11:12
去年换了显示器更新了驱动开始每天不固定蓝屏至少一次,更新显卡固件,降级稳定驱动以后稳定陈每天开机一次 ...

每天稳定开机一次蓝屏。。。。

xcdry 发表于 2025-5-20 11:31

我自横刀 发表于 2025-5-20 11:23
每天稳定开机一次蓝屏。。。。

开机直接蓝屏,蓝屏以后正常用,就问稳定不稳定吧。。。

archxm 发表于 2025-5-20 11:32

我 7900xt,在用这个驱动,没事啊

我自横刀 发表于 2025-5-20 15:13

本帖最后由 我自横刀 于 2025-5-20 15:15 编辑

https://learn.microsoft.com/en-u ... redirectedfrom=MSDN

错误检查 0x4E:PFN_LIST_CORRUPT
文章2023年5月22日

PFN_LIST_CORRUPT 参数PFN_LIST_CORRUPTParameters


PFN_LIST_CORRUPT 错误检查的值为 0x0000004E。这表明页帧编号 (PFN) 列表已损坏。

重要的

本文面向程序员。如果您是客户,并且在使用计算机时收到蓝屏错误代码,请参阅蓝屏错误疑难解答。

PFN_LIST_CORRUPT 参数PFN_LIST_CORRUPTParameters
参数 1表示违规类型。其他参数的含义取决于参数 1的值。


原因
此错误通常是由驱动程序传递了错误的内存描述符列表引起的。例如,驱动程序可能使用同一个列表调用了两次MmUnlockPages 。

如果有内核调试器可用,请检查堆栈跟踪:!analyze调试扩展显示有关错误检查的信息,并有助于确定根本原因,然后输入其中一个k(显示堆栈回溯)命令来查看调用堆栈。
PFN_LIST_CORRUPTParameters
参数 1表示违规类型。其他参数的含义取决于参数 1的值。

参数 1参数 2参数 3参数 4错误原因
0x01已损坏的ListHead值可用页数0列表头已损坏。
0x02列表中被删除的条目最高物理页号被删除条目的引用计数列表条目已损坏。
0x06页框号PTE原型PTE内容硬件 PTE 和/或原型 PTE 数据结构已损坏。这可能是由硬件单位错误、DMA 传输中断等原因造成的。
0x07页框号当前股份数量0驱动程序解锁某个页面的次数比锁定该页面的次数多。
0x8D状态不一致的页框号00可用页面列表已损坏。此错误代码很可能表示硬件问题。
0x8F新的页码旧页码0空闲或清零的页面列表头已损坏。
0x99页框号当前页面状态0页表项 (PTE) 或 PFN 已损坏。
0x9A页框号当前页面状态正在删除的条目的引用计数驱动程序尝试释放仍处于 IO 锁定状态的页面。


TK93 发表于 2025-6-1 23:02

本帖最后由 TK93 于 2025-6-1 23:14 编辑

你是N卡还是A卡?N的话回退哪个版本? 也是差不多时间段出现大概在4月末、
同款4e 也一直怀疑内存 。。。看不懂代码直接deepseek分析全都指向内存也有人说是CPU带不动8000HZ然后又把EXPO关了还是会....
也DDU过没用感觉AMD CPU毛病真多

TK93 发表于 2025-6-1 23:16

本帖最后由 TK93 于 2025-6-1 23:20 编辑


不对我好像理解错了你是回退的AMD CPU驱动?
看成显卡驱动了。退到哪个版本 ?

其实我至今都没整明白AMD这个软件到底是CPU驱动还是显卡驱动,惆怅

zerozerone 发表于 2025-6-1 23:35

用着26100.xxxx别嫌驱动毛病多 嘿嘿。

我自横刀 发表于 2025-6-1 23:42

zerozerone 发表于 2025-6-1 23:35
用着26100.xxxx别嫌驱动毛病多 嘿嘿。

26100有啥说法吗?

zerozerone 发表于 2025-6-2 00:10

我自横刀 发表于 2025-6-1 23:42
26100有啥说法吗?

系统驱动库拉抽屉的水平史无前例了。26100仅仅是纸面上从ge变rtm.

另外26100系统下的12.2不确保相对完整支持、着色器、硬件加速调度等等可都比w10下的特性、功能有所更新。
内置驱动尚不完善的情况下,更何况配套的api\runtime。

zerozerone 发表于 2025-6-2 00:12

微软最新的系统对于amd平台的友好程度相对intel差些。

TK93 发表于 2025-6-9 21:57

最新的25.6.1既然也会....你试过禁用核显吗?

lh4357 发表于 2025-6-9 22:09

这个蓝屏印象中遇到过一次,是10代ring超太高。
页: [1]
查看完整版本: 近期频繁出现奇怪的4e蓝屏,一度以为内存坏了,最后发现是显卡驱动问题