星辰柯博文 发表于 2023-7-18 19:57

求教牙膏厂13900KS whea19问题(定频定压)

本帖最后由 星辰柯博文 于 2023-7-18 20:07 编辑

警告        2023/7/12 15:46:54        WHEA-Logger        19        无

出现已更正的硬件错误。

由以下组件报告: 处理器核心
错误源: Corrected Machine Check
错误类型: Internal parity error
处理器 APIC ID: 40

出错的APIC ID有16 32和40、48。频率大核56/小核44/ringbus49,电压1.25v (微星黑刀锋z690 防掉压mode3),内存4000C16 gear1。

请教各位dio大的:
1、牙膏厂的whea19和什么相关,核心频率、ringbus频率还是imc频率?需要降频(或者加压)哪一项?
2、13900KS最多32个线程,“APIC ID: 40”和“48”从何而来?
3、该问题完全随机出现,R15/20/23、yc烤鸡都不会出这个问题,何解?

yoloh 发表于 2023-7-18 20:19

本帖最后由 yoloh 于 2023-7-18 20:21 编辑

whea 19一般是内存控制器问题。
测试软件一般只测试核心,内存控制器没啥压力。
你去跑aida64的stress memory和stess cache就容易复现了。

星辰柯博文 发表于 2023-7-18 20:26

yoloh 发表于 2023-7-18 20:19
whea 19一般是内存控制器问题。
测试软件一般只测试核心,内存控制器没啥压力。
你去跑aida64的stress memo ...

yc和TM5 extreme1 anta777随便烤。
这玩意报错完全是随机的。
最奇怪的是,APIC ID有40、48。13900KS根本没有这两个线程号。算上超线程,也只有32个线程。

病嬌鬼畜蘿莉控 发表于 2023-7-18 20:44

TM5和FURMARK一起烧就知道问题了[恶魔]

blurskyfri 发表于 2023-7-18 20:51

星辰柯博文 发表于 2023-7-18 20:26
yc和TM5 extreme1 anta777随便烤。
这玩意报错完全是随机的。
最奇怪的是,APIC ID有40、48。13900KS根本 ...

APIC ID用CPU-Z来看
运行后直接点下面的Tools(工具)
选择Save report as .TXT
然后打开TXT就能看到APICs
下面的就是对应的ID号
比如类似这样的:

APICs
-------------------------------------------------------------------------

Socket 0       
        -- Core 0 (ID 0)       
                -- Thread 0        0
                -- Thread 1        1


然后是那个WHEA 19的问题
我这里之前也遇到过
主板是MSI的Z690,降压那个选择的LV3,设置1.25V左右的时候跑R23会自动降压到1.154V左右,这时跑R23大概率弹窗报错并且系统日志中WHEA19
内存压力测试也跑过没问题
于是把自动降压那个调到LV2,这样跑R23的时候自动降压到1.165V以上的时候,WHEA19就不再出现了
我这里当时报的APIC ID是16,猜测是对应的大核体质稍差,降压后不稳定

现在就是设置的CPU核心电压1.26V+降压LV2
比较有意思的是会出WHEA19的时候,R23最高跑到过31000分多核得分,现在稳定不出现WHEA19之后随便怎么跑都是30600~30700的样子

星辰柯博文 发表于 2023-7-18 21:02

blurskyfri 发表于 2023-7-18 20:51
APIC ID用CPU-Z来看
运行后直接点下面的Tools(工具)
选择Save report as .TXT


谢谢                     

星辰柯博文 发表于 2023-7-18 21:49

blurskyfri 发表于 2023-7-18 20:51
APIC ID用CPU-Z来看
运行后直接点下面的Tools(工具)
选择Save report as .TXT


Internal parity error和Translation Lookaside Buffer Error,到底是核心问题还是内存控制器?

blurskyfri 发表于 2023-7-19 08:04

星辰柯博文 发表于 2023-7-18 21:49
Internal parity error和Translation Lookaside Buffer Error,到底是核心问题还是内存控制器? ...

我这里当初出现的那一堆WHEA19里以后面的TLB报错居多,前面的那个报错比较少。
从我这里事后的情况看,至少我这里是核心不稳定导致的,因为减少核心的降压幅度就没有报错了。
至于是否有其他可能……嗯……我当时也搜了很多,没找到确切的说法。[流汗]

星辰柯博文 发表于 2023-7-19 08:48

blurskyfri 发表于 2023-7-19 08:04
我这里当初出现的那一堆WHEA19里以后面的TLB报错居多,前面的那个报错比较少。
从我这里事后的情况看,至 ...

我先试试vddq加0.01吧
页: [1]
查看完整版本: 求教牙膏厂13900KS whea19问题(定频定压)