找回密码
 加入我们
搜索
      
查看: 18659|回复: 72

[CPU] Intel找到13和14代酷睿稳定性问题的根本原因:是eTVB代码错误导致

[复制链接]
发表于 2024-6-15 11:30 | 显示全部楼层 |阅读模式
本帖最后由 sthuasheng 于 2024-6-15 16:11 编辑

第13代和第14代K系列处理器的故障分析表明,由于核心电压的累积升高,受影响处理器的最低工作电压发生了变化。Intel分析已确定导致此问题的一个确认因素是处理器的输入电压升高,这是由于之前的BIOS设置允许处理器在高温下以超频频率和电压运行。由于默认工作电压和频率较低,前几代英特尔K系列处理器对此类设置不太敏感。

Intel要求所有客户在2024年7月19日之前将BIOS更新到微代码0x125或更高版本。此微代码包含一个eTVB修复程序,该修复程序可解决一个问题,即使处理器温度已超过eTVB阈值,该问题也可能允许处理器进入更高性能状态。


最新更新:intel表示这个bug虽然是intel的问题,但是cpu不稳定最大的锅还是主板厂商的。
WeChat截图_20240615161002.jpg
发表于 2024-7-8 23:10 | 显示全部楼层
俊华V网络 发表于 2024-7-3 15:54
还没有发售时铺天盖地的全民6G时代现在变全民技术流(BIOS各种调)

还是在DIY已经越来越稀罕的情况下。哈哈哈
发表于 2024-7-8 08:46 | 显示全部楼层
Neptrock 发表于 2024-7-7 22:52
我刚又试了下
防掉压还是设的mode 7(高负载时掉压倒数第二多的一档)
P核定频5.4G,E核定频4.3G,开超线 ...

B系主板好像没有固定电压的手段。。我常年用Z板的,不是很清楚B板这边怎样
发表于 2024-7-8 00:36 | 显示全部楼层
OMGJL 发表于 2024-7-5 11:22
据我的理解CPU Lite Load只是调节电压的手段而已,如果你已经定压定频,你可以直接调整VID和LLC,不需要 ...

MSI主板,定频定压状态下 AC/DC loadline默认不生效,不要去动它。直接调节CPU电压即可。
发表于 2024-7-7 23:33 | 显示全部楼层
nemo1217 发表于 2024-6-15 11:48
现在微码不仅跟着bios,windows如果发现bios微码比自己带的版本低,会在启动的时候加载更新的微码。用户 ...

只是win11吧?W10没有?
发表于 2024-7-7 22:52 | 显示全部楼层
OMGJL 发表于 2024-7-5 11:22
据我的理解CPU Lite Load只是调节电压的手段而已,如果你已经定压定频,你可以直接调整VID和LLC,不需要 ...

我刚又试了下
防掉压还是设的mode 7(高负载时掉压倒数第二多的一档)
P核定频5.4G,E核定频4.3G,开超线程
AC LL=5
DC LL=110
内存是mdie XMP 6800C34,频率小超到了7200,还是C34,其他小参没动,选了performance模式

y-cruncher跑VT3,跑了15圈,31分钟,懒得再跑下去了,没报错。

跑VT3的时候软显功耗237W,CPU核心电压1.180V,VID没截到,也是1.1×,但是比1.180要低一点。待机的时候VID是1.25-1.26左右,核心电压最高的时候差不多也跑到这个。

感觉这样应该也没什么问题了吧,R23分数也差不多正常,35500,只比默频少了500分。
但我有个问题,我BIOS里找不到CPU定压的设置在哪里,核心电压只有个offset模式,怎么找都没找到
我看别人同样是微星B760,就有CPU Core Voltage Mode选项,可以设成Override,但我就只有CPU Core Voltage Offset Mode,微码选normal还是no uvp之类的都没用,也不知道我是不是哪里没设对

MSI_SnapShot_05.jpg

发表于 2024-7-5 16:00 | 显示全部楼层
OMGJL 发表于 2024-7-5 11:22
据我的理解CPU Lite Load只是调节电压的手段而已,如果你已经定压定频,你可以直接调整VID和LLC,不需要 ...

我就是也觉得不合逻辑,那我换HWinfo看看
水泵转速那个也是风扇,我是风冷,但散热器两个风扇不一样,所以分开两个接口接的,方便拉曲线
定压定频的话待机功耗和温度会上去不少吗?我还没试过,今天晚上再试试看
发表于 2024-7-5 11:22 | 显示全部楼层
Neptrock 发表于 2024-7-4 15:14
我昨天试了下把LLC调到下图里的mode 8,结果连R23都跑不过,加了电压之后又有点压不住(我14700K,风冷) ...

据我的理解CPU Lite Load只是调节电压的手段而已,如果你已经定压定频,你可以直接调整VID和LLC,不需要碰Lite Load,MSI网站上有一个Wiki就是这么写的,个人理解是当你需要负压曲线的时候用这个比较方便。。不过因为我是定压定频的,所以我个人没碰过Lite Load,如果我说的和实际有出入那我就不清楚了。。

你的功耗和电压感觉不合逻辑,不确定是不是监控软件抓到的瞬间功耗变动刚好卡在了奇怪的地方,建议用HWinfo看功耗, AIDA直接弃用(反正AIDA的压测也测不出什么来)
不过你的水泵转速什么的也不一样,感觉你需要控制一下变量。。

我13700k配最低级防掉压,如果想跑5.5Ghz大约需要1.385v VID,实际满载1.265左右。有超线程,但关小核
发表于 2024-7-4 20:39 来自手机 | 显示全部楼层
这不应该召回吗?
发表于 2024-7-4 20:13 | 显示全部楼层
本帖最后由 威尼斯睡裤 于 2024-7-5 09:19 编辑

编辑编辑部
发表于 2024-7-4 15:14 | 显示全部楼层
OMGJL 发表于 2024-7-3 20:22
低LLC有优势,但不是绝对优势,对比中等级LLC,实际满载需求电压会低0.01~0.02v,相对比高等级LLC,可能 ...

我昨天试了下把LLC调到下图里的mode 8,结果连R23都跑不过,加了电压之后又有点压不住(我14700K,风冷),于是又调回了mode 7
LLC.jpg

然后在LLC为mode 7的条件下,我把下图中的CPU Lite Load调到了mode 2(数字越小电压越低)。
图是网上找的
cpu lite load.jpg


CPU Lite Load在mode 2下R15、R23啥的都能跑过,跑分都和网上的差不多。
单烤FPU的功耗温度↓

FPU温度(M2).jpg


我还尝试过调到mode 1,跑分也差不多,单烤FPU的电压更低,温度也低,但是功耗反而比电压高的mode 2高了一截。
↓这个是开超线程下,mode 1和2的对比
开超线程FPU温度m1和m2对比.jpg


这两个电压和功耗正常吗?会不会太低?或者如果能跑过y-cruncher是不是就可以正常用了?
跑这些测试没问题之后,我日常是会关掉超线程用的。
发表于 2024-7-3 20:22 来自手机 | 显示全部楼层
本帖最后由 OMGJL 于 2024-7-3 20:51 编辑
Neptrock 发表于 2024-7-3 16:23
所以意思是不是如果想要不缩缸且温度低,就这么设:
防掉压曲线设成掉压最多的那一档,然后调降压,降到 ...


低LLC有优势,但不是绝对优势,对比中等级LLC,实际满载需求电压会低0.01~0.02v,相对比高等级LLC,可能再低0.01~0.02v,加起来0.03v 了不起0.04v。。不至于化腐朽为神奇,但是确实可以减少缩缸风险,也可以稍微降低温度。 (缩缸风险是 对比满载电压相同的高LLC模式,实际 电压越低->电流越低 -> 越不容易缩缸)

139k 149k定压定频低LLC,配合普通民用散热,电压不拉爆,很难达到5.9/ 6.0Ghz,实际点5.3Ghz一般能降一点电压日用舒服些,用最高不过热的电压: 普通体质5.5~5.6Ghz,强一点的5.7Ghz,要能稳5.8+真的屁股都笑裂了。
也别看不起5.3~5.6这个区间,比Intel Baseline/Stock强的多,并且频率锁死不会跳动,帧数很稳。主频低一点内存也许还能多超一点。。

实际操作:
最低档防掉压,vid尽量不要超过1.4太多(如果还想加压,别再加VID了,逐步增加防掉压等级),实际上满载大约1.3多点  估计常规室温下,一般散热器就压不住了,
压不压得住,看核心顶盖是不是雕,也看散热器有多强,空调有多顶,各种钞能力。。

然后跑压力更大的ycruncher(打开程序按1、7、0  
1=压测模式,7=启用全部测试项目,0=开始压测    也就是循环全部测试项目)

如果有超内存,关掉测试后重新打开,按1、8、15、0
1=压测模式,
8=禁用全部测试项目,
15=启用VT3压测项目(注意不同版本VT3序号不同,自己看屏幕提示)
0=开始压测  

两整圈以上全套测试  20圈以上VT3
如果能稳,可以不加压直接日用、游戏,99.9%是稳的(说话不要说得太满)

评分

参与人数 1邪恶指数 +5 收起 理由
Neptrock + 5 支持一下

查看全部评分

发表于 2024-7-3 16:23 | 显示全部楼层
OMGJL 发表于 2024-7-3 06:13
咱从头说。 名词: VID (设定电压值) VCORE(实际电压值)

定压定频时,频率是固定的,运算越重,电流 ...

所以意思是不是如果想要不缩缸且温度低,就这么设:
防掉压曲线设成掉压最多的那一档,然后调降压,降到跑R15啥的都没问题再回一点就行了?
发表于 2024-7-3 16:20 | 显示全部楼层
又是达到温度上限的时候没限制主频?貌似不止I家,去年的A家也有类似情况。
发表于 2024-7-3 15:54 | 显示全部楼层
还没有发售时铺天盖地的全民6G时代现在变全民技术流(BIOS各种调)
发表于 2024-7-3 15:45 | 显示全部楼层
Epipihany 发表于 2024-7-3 14:18
算了吧,你有些基础的东西比如开关电源的原理都没弄清楚,在你没补课之前,咱就没有讨论的必要了 ...

我求求你别找牌面了,看不懂技术手册就别强行翻了。扯得越多,错的越多,越丢人。

SVID是干嘛的,VRM是干嘛的,两者什么关系?
BIOS里找一下VRM Switching Frequency看看里边的选项是多少数字

PLL是频率管理相关,怎么就让你扯到电源管理的电压调节开关频率了?

亏得我还给你打字科普,

你没活可以考虑咬个打火机,这个比较脆生,不像你找一堆风牛马不相及的资料,放在一起搞得好像你很懂一样。
发表于 2024-7-3 14:18 | 显示全部楼层
OMGJL 发表于 2024-7-3 13:24
SVID协议的通信时钟频率和VRM开关频率你都搞混了,打住。

算了吧,你有些基础的东西比如开关电源的原理都没弄清楚,在你没补课之前,咱就没有讨论的必要了
发表于 2024-7-3 13:24 | 显示全部楼层
Epipihany 发表于 2024-7-3 11:23
首先对你表示感谢,正是因为这个帖子,让我从底层了解了CPU的PM架构;同时也借这个机会,希望你不再被这 ...

SVID协议的通信时钟频率和VRM开关频率你都搞混了,打住。
发表于 2024-7-3 11:23 | 显示全部楼层
本帖最后由 Epipihany 于 2024-7-3 11:35 编辑
OMGJL 发表于 2024-7-3 06:13
咱从头说。 名词: VID (设定电压值) VCORE(实际电压值)

定压定频时,频率是固定的,运算越重,电流 ...


首先对你表示感谢,正是因为这个帖子,让我从底层了解了CPU的PM架构;同时也借这个机会,希望你不再被这些口口相传的错误理论误导了。

你提到的V与F没有关联,说明你没有了解过PLL(锁相环);无妨,我花费了一些时间,稍微去看了些官方的文档,如下:

1. CPU 电源管理一些前置资料见DLVR图片, 简单来说,CPU的VCCCORE/VCCGT等电源轨都是由DLVR输出的,与VCCCORE/VCCGT的DLVR受SVID控制
解释下SVID,他与一个协议相关,全称IMVP xx PWM Specification And SVID protocol Specification,通过CPU通过这个协议控制给VRM发送相应的SVID_DATA获取不同的电压;


2. 至于你说的VRM工作频率300Khz 到500Khz,这也是错误的;虽然找不到适配13/14TH CPU最新版的IMPV9.1的协议原档,但是从09年版的IMVP7以及一份2020年的Intel的SVID培训PPT中所得的数据,SVID_CLK时钟频率就是很普通的SMBUS:25MHZ


3. 整理了下,CPU电源管理一个大概的草图如下,当然个人水平有限,有任何谬误及不足之处请不吝指出。提及的SVID协议以及培训PPT链接如下:
https://pan.baidu.com/s/1qpbnQ0PaAtqwOoS8t1ovTA?pwd=b4y9 提取码: b4y9


PowerDelivery.png
SVID_timing.png
SVID_sampling.png
CPU_PowerManagement.png
发表于 2024-7-3 06:20 | 显示全部楼层
Epipihany 发表于 2024-6-30 08:19
“有点常识,不会就多搜索下”

首先,我为我这句回复诚恳向你道歉,的确是语气过激。

另外,CPU是被动接受Vcore供电的。。他想参与进来只能靠报不同的VID值。定压相当于VID Override。

你说的情况是CPU睿频、TVB的时候动态给自己加压。我说的定压定频可以排除这个变量。
发表于 2024-7-3 06:17 | 显示全部楼层
初音空岛 发表于 2024-7-1 16:24
防掉压拉满就等于定压

大错特错,看53楼。
发表于 2024-7-3 06:13 | 显示全部楼层
本帖最后由 OMGJL 于 2024-7-3 06:29 编辑
Epipihany 发表于 2024-6-30 08:19
“有点常识,不会就多搜索下”

首先,我为我这句回复诚恳向你道歉,的确是语气过激。


咱从头说。 名词: VID (设定电压值) VCORE(实际电压值)

定压定频时,频率是固定的,运算越重,电流越高。  V/F里没F什么事,V的话:CPU彻底放手VID,主板设多少就是多少。 CPU自动调整V/F这里, 你的理解可能有问题。


套几个数字方便理解:

低LLC:
比如你设1.38,实际空载(电流小的时候)1.375,满载(电流大的时候)1.30  看起来很惨,实际上不惨。原因等下说
高LLC:
比如你设1.31,空载1.31,满载也1.31,看起来很美好,实际问题很大。

物理特性:电流越高电压越低。LLC希望达成的目的是 电压变低的时候,动态矫正电压,让电压永远保持不变。然而我说的波峰波谷,是指微秒级的响应。

VRM的工作频率大约是 300Khz 到500Khz,了不起1000khz
CPU的工作频率(按5Ghz算),是5000Mhz = 5,000,000khz        
CPU每5000~10000个动作,VRM才能响应一次。。。 5Ghz vs 500Khz = 0.2纳秒 vs 2000纳秒


假设某一颗CPU,达成5Ghz (频率数字本身并不重要)需要的电压是1.29v,在负载最重的时候一旦低于1.29马上报错。 问题来了:

高LLC模式,
CPU负载变高=电流变高电压变低,然后几千纳秒之后 VRM检测到变化,开始加电压。 注意这几千纳秒以内电压掉了是没人管的 (设的1.31,如果这个瞬间掉到1.30以下,报错闪退GG。)

等负载变低之后,电流变小电压变高,几千纳秒之后 VRM检测到,再把电压降回来。这几千纳秒里电压直冲天际也是没人管的。

比这个更惨的问题是。。。VRM拉电压是动态的,加电压一直加,等检测到电压超过设定值再降,降电压一直降到检测到过低再拉回。 (我说的波峰谷峰就是这里)  高LLC就好比你在开车追前车,但是没留安全距离。等你看到他刹车的时候,你已经要撞上了。

低LLC模式,

确实电压忽然就掉了很多,但是这里不需要VRM介入,电流越大电压越低,最大电流的情况下vcore还是1.30,VRM不需要介入这个过程。只要我VID设的足够高,全程vcore都不会掉下稳定线1.30v。 你怕的不是他掉压,而是你怕电压低于稳定线。

所以钽电容主板被吹的那么厉害,高LLC也能靠钽电容撑过负载变化的瞬间。


那么你可能会说,啊你低LLC, VID都快1.4v了,你早晚缩缸。。。。并不, 高电压大电流才容易缩,这里大电流的时候电压早就掉了。。。低电流的时候电压高。都没几瓦功耗,高就高呗。。
反而高LLC才容易缩缸,负载上去的瞬间VRM响应的时候,会等检测到电压超过设定值,才会往回降。

你可能还会说: 我的监控软件怎么从来没看见过高LLC的瞬间波峰波谷?  你的监控软件每秒刷新,了不起0.1秒刷新一次,差了数十万倍。

评分

参与人数 1邪恶指数 +5 收起 理由
Neptrock + 5 谢谢科普

查看全部评分

发表于 2024-7-1 16:27 | 显示全部楼层
板厂:阿米诺斯 诺斯 诺斯
发表于 2024-7-1 16:24 | 显示全部楼层
Epipihany 发表于 2024-6-30 08:19
“有点常识,不会就多搜索下”

首先,我为我这句回复诚恳向你道歉,的确是语气过激。

防掉压拉满就等于定压
发表于 2024-6-30 08:19 | 显示全部楼层
本帖最后由 Epipihany 于 2024-6-30 08:20 编辑
OMGJL 发表于 2024-6-28 09:30
觉得自己有道理的时候就嚣张 让人有点常识

说不过了就往地上一躺打滚


有点常识,不会就多搜索下

首先,我为我这句回复诚恳向你道歉,的确是语气过激。

"你自己这句话前后矛盾。。
防掉压开高,电压峰值谷值会更剧烈, 而我开的是最低。

低防掉压只会跟着电流的变动自己掉压,不会被VRM过度补偿。
"

这是你的回复,再看看我最开始的回复:

防掉压开最低过冲会更加剧烈,你体质差点,默频分分钟崩溃,你都定频定压了就不需要开很高的防掉压了

首先,LLC开level1补偿少,负载变化,spike和collapse就会很大,这是我们都确认的事实;其次,定频定压这里我们可能都存在误区,认为只要设置定频定压后,CPU就能自动调整V/F,我们先假设这个前提成立,我的观点你不需要开很高的防掉压就不矛盾。

再来说说这个定频定压,目前我对单纯靠设定定频定压这种配置就能保证CPU在负载变动剧烈的情况,就能控制掉压保持怀疑;首先,负载变化,在不实施任何补偿情况下,负载端电压必然出现spike和collapse,为了保持定压,CPU会通过提交不同的VID请求获取相应的实时电压,并通过LLC对其进行微调;所以,说到底定频定压与AUTO都只是预设的配置值,CPU调压的机制还是VID+LLC。

最后再说下,我不是专业的CPU设计领域从业人员,以上只是我个人依据CPU手册以及官方文档加上些许硬件领域的粗浅知识所得出的解读,不合理之处还请专业人士指出。

谢谢!
发表于 2024-6-28 11:20 | 显示全部楼层
果然是买最贵的CPU享受最复杂的问题
发表于 2024-6-28 09:30 | 显示全部楼层
Epipihany 发表于 2024-6-27 17:17
讨论再多无意义,不如向消协投诉

觉得自己有道理的时候就嚣张 让人有点常识

说不过了就往地上一躺打滚
发表于 2024-6-27 17:17 | 显示全部楼层
本帖最后由 Epipihany 于 2024-6-27 18:23 编辑

讨论再多无意义,不如向消协投诉
发表于 2024-6-27 13:08 | 显示全部楼层
本帖最后由 OMGJL 于 2024-6-27 13:14 编辑
Epipihany 发表于 2024-6-25 09:03
有点常识,不会就多搜索下


你能不能不要太自信?

Vdroop = 掉压,  VID = 你设置的数值(不是实际CPU吃到的电压值)

VID不变的前提下,掉压多 -> CPU实际拿到的电压低 -> 超频能力弱

我怎么说的?

拉高VID,再设低LLC。  满载实际吃到的电压并不低。

LLC(防掉压)是靠VRM识别供电电流大小,然后动态调节电压,VRM响应速度一般也就300~500 Khz

电流、电压变动 -> VRM检测到 -> 补偿电压or降电压 -> 检测到补偿多了or降多了 -> VRM再往回拉电压

你LLC设定越激进,动态调整电压的幅度就越高,瞬时波峰波谷就更多

最低LLC, 掉压就是掉了,不会再补偿。 我VID设的高,掉压后依旧保证稳定,这个过程中不需要VRM响应速度。

你要是不理解,上网搜搜LLC数值不同在示波器下的表现,再来和人对线好吗?
发表于 2024-6-25 10:13 | 显示全部楼层

本帖最后由 ishadow 于 2024-6-25 10:14 编辑

堆了那么多小核,然后还要靠七伤拳才能赢,现在就是不承认自己有错,反正有销量不愁卖,缩缸了依然有大把人花钱买
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-4-28 15:58 , Processed in 0.019174 second(s), 12 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表