找回密码
 加入我们
搜索
      
查看: 9218|回复: 81

[CPU] 关于砸钱试稳intel 13 14代,目前有了重要的阶段性总结,暂时画上句号

[复制链接]
发表于 2024-5-27 12:16 | 显示全部楼层 |阅读模式
本帖最后由 kmdkai 于 2024-5-28 12:04 编辑

话题紧接【砸钱试稳13900K14900K。intel的BIOS baseline设定完全没解决任何问题】不了解前情的请先看前情。

14900ks.png
先晒一下近期我购买的14900KS记录,大部分是选择二手盒装产品,目的是验证比较二手盒装产品与全新到底有无差异。目前结论是二手盒装与全新盒装无差异(手残折腾坏的除外)。
BTW:全新盒装14900KS我也买了几个先不晒图。

chhasus.png
这里表扬一下华硕那边主动站内信跟我联系,安排技术跟我这边对接,让我出乎预料。看来CHH论坛卧虎藏龙果然名不虚传。

asuswechat.png
这是前几天我们大概确定问题结论后的部分聊天记录。
经过最近两周的调测,我们的结论已经比较石锤,所以打算抢先一步在板卡厂商更新BIOS前,先透露我们自己的结论。
BTW:目前我们还没把发现与细节明确告诉华硕或任何第三方,先发出来目的是为了等后大范围的新版本BIOS更新后,确定与我们的发现是否一致。


首先分享下自上次我在本论坛发表砸钱试稳帖子后,期间发生的故事:
1、不到两天时间,收到站内信,与华硕技术沟通,我也将这边测试的过程和方法告知华硕那边。
2、后续几天里我们开始采购14900KS处理器进行普遍测试。初期结论是14900KS在intel baseline设定下表现稳定性确实有提高,明显比14900K更稳定。
3、由于认识从事服务器的大佬,所以借用大佬的机房,在后续十多天时间里机器都放机房里进行重复调测。
4、有一次帮大佬调测第五代至强铂金服务器在默认设定状态下非常卡顿的问题,我在十多次调测中偶然发现了造成性能异常卡顿的原因。忽然意识到既然这个选项跟处理器的某个设定有关,立刻联想到关于13、14代处理器限制上限后不稳定因素极有可能跟这个相关,于是我立刻进行验证。
5、随后十多天时间里,我用十多台机器,总计进行不下一百次的重复调测,最终锁定了原因。

说了这么多,现在回到关于13、14代不稳定主题,目前我们的阶段性总结:
问题可以总结为两方面,上限与下限问题,上限问题在不加以限制情况下容易立刻显现(比如此前高负载秒崩溃的问题),下限问题是潜在性的只有在特定类型工作负载下才会显现(比如不超频情况下某些游戏或程序运行期间出现不稳定随机崩溃问题)。
几乎一切的主要问题源自于‘下限’,应该是intel过于借鉴以往经验,在压榨处理器极限同时未对稳定性进行充分考量与测试。我们的猜想:应该是intel急于求成推出能与AMD锐龙抗衡的产品,因此疏忽或忽略了某些本该严格的测试流程。BTW:我不对这句话负责,这只是猜想。
1、关于上限问题,intel和各大厂商及时通过更新BIOS限制上限(所谓的intel baseline也好,default setting也罢)来解决,确实对不加以限制从而容易立刻显现的上限导致的不稳定有改善。但是导致了性能损失。
2、限制上限后,紧接着的不稳定因素源自于‘下限’,‘下限’是比较潜在性的,在常规拷机与压力测试中无法触发,必须在特定类型负载或状态下会有较大概率触发。这里‘下限’我暂时不指名具体是什么。
3、通过我们近百次测试,关于对‘下限’相关的问题因素进行规避设定,目前实测生产力场景基本可以稳定使用,并在B板Z板同步测试。
4、后续我们又扩展了测试,对‘下限’相关的问题规避,同时适当在Z板上解除上限限制,14900K和14900KS终于可以Z板既稳定性能又畅快淋漓。


此致,为今年这一场无厘头的砸钱试稳故事画上句号。虽然心累但好在已经知道了问题原因。

特别感谢我的那位服务器大佬无私提供机房机位资源,让我能够以不可能的效率进行近百次的测试快速寻找原因。而且也正是机缘巧合下让我发现了处理器‘下限’问题。
基于无私互助原则,我已经率先将问题详细原因和解决方法分享给了服务器大佬,帮助他们机房解决了全部13、14代处理器生产力的可靠性问题,优先确保他们的业务顺利运行。目前初期效果反馈很好。

那么接下来,就看intel和各大厂商表演的时刻了,有请intel和各厂商开始你们的表演!
我计划等后续intel和板卡厂将问题解决之时,或者几个月后下一代产品上市之前intel和板卡厂还是折腾不好,我们再公布具体的发现和原因。当然intel也可能会选择摆烂这一代,毕竟下一代产品马上就出了。

补充:为避免装腔作势故弄玄虚嫌疑。我按目前经验先给大家一个可能有助于减轻不稳定问题解决的解决方案:
现阶段,采取定频定压(不超频且不超默认设定)+系统电源配置设定为高性能或卓越性能(让最低处理器状态是100%),是缓兵之计。
因为这个模式下,处理器不需要频繁调整自身状态,会在稳定的舒适区下工作,进而很可能有助于提高稳定性,只是这个舒适区不太好摸,有一些门槛。
具体我没这样试过,这只是根据目前已知的原因给出一个理论上的偏方,我认为会有效果。目前我也十分期待下一版BIOS更新intel和板卡厂的工作到底能否见成效。

评分

参与人数 1邪恶指数 +5 收起 理由
MrHydra + 5 支持一下

查看全部评分

发表于 2024-5-27 12:20 | 显示全部楼层
下限还能是啥,肯定电压呗
 楼主| 发表于 2024-5-27 12:21 | 显示全部楼层
gartour 发表于 2024-5-27 12:20
下限还能是啥,肯定电压呗

稍微有点关系,但并不全是。所以我更乐意看着后续intel和各大板卡厂商的表演。毕竟看热闹不嫌事儿多。
发表于 2024-5-27 12:22 来自手机 | 显示全部楼层
如果还是需要手动设置比如在放开上限方面,意味着要花相当时间和成本测试稳定性,这和各形式的手动超频差别不大啊。
发表于 2024-5-27 12:25 | 显示全部楼层
LGA1700的CPU SOCKET电压超过1.3V 频率超过5.5G就开始失控
 楼主| 发表于 2024-5-27 12:26 | 显示全部楼层
本帖最后由 kmdkai 于 2024-5-27 12:47 编辑
momoka 发表于 2024-5-27 12:22
如果还是需要手动设置比如在放开上限方面,意味着要花相当时间和成本测试稳定性,这和各形式的手动超频差别 ...


现阶段intel和板卡厂商都还在努力寻找问题阶段,所以暂时不解开上限还是对的,因为不限制上限问题只会更快暴露。
发表于 2024-5-27 12:46 来自手机 | 显示全部楼层
电压频率曲线问题?
发表于 2024-5-27 12:48 | 显示全部楼层
我还以为他们5月能搞定呢
发表于 2024-5-27 12:48 来自手机 | 显示全部楼层
玩家比英特尔的工程师更懂 cpu
发表于 2024-5-27 12:54 来自手机 | 显示全部楼层
Intel就是个搓沙子的,他懂什么cpu(乐
发表于 2024-5-27 12:57 | 显示全部楼层
本帖最后由 星辰柯博文 于 2024-5-27 13:01 编辑

低压太低,高压太高,中间波动范围过大。
在不限制电流的情况下,149KS R15电流可达400A以上,此时出现严重的掉压。提升CPU防掉压补偿,会增加瞬时高压,反复瞬时高压导致缩缸。提升AC/DC防掉压,又会让待机电压非常高。
以上两点加在一起,现有的数字供电精度完全跟不上CPU的睿频需求,定频定压得了。
硬要追求游戏高频,限制电流墙小于300,关掉cstate,规避电压高低波动过大和过流导致的严重掉压。

既要待机功耗低,又要单核灰烬频率,既要又要就是这样子的。
发表于 2024-5-27 13:00 | 显示全部楼层
感谢楼主的辛苦测试
为楼主的这种用实践检验真理的精神点赞!
发表于 2024-5-27 13:04 来自手机 | 显示全部楼层
星辰柯博文 发表于 2024-5-27 12:57
低压太低,高压太高,中间波动范围过大。
在不限制电流的情况下,149KS R15电流可达400A以上,此时出现严重 ...

数字供电精度,取决主板?
发表于 2024-5-27 13:09 来自手机 | 显示全部楼层
话说,楼主是某小主板厂的工程师?还是老板
发表于 2024-5-27 13:11 | 显示全部楼层
archxm 发表于 2024-5-27 13:04
数字供电精度,取决主板?

目前的供电模式无解。
发表于 2024-5-27 13:12 来自手机 | 显示全部楼层
星辰柯博文 发表于 2024-5-27 13:11
目前的供电模式无解。

要我说,长痛不如短痛
发表于 2024-5-27 13:15 | 显示全部楼层
2024 Q4  ultra 2代  桌面端 就发布了。都忙着 生产封装、调试 ultra 2代 ,你还指望intel 给找 13、14代缩肛暴毙的原因,反正召回 是不可能的
 楼主| 发表于 2024-5-27 13:18 | 显示全部楼层
星辰柯博文 发表于 2024-5-27 12:57
低压太低,高压太高,中间波动范围过大。
在不限制电流的情况下,149KS R15电流可达400A以上,此时出现严重 ...

这位兄弟说的比较专业有一些道理,想必也是经历过很多折腾之人啊。
 楼主| 发表于 2024-5-27 13:18 | 显示全部楼层
archxm 发表于 2024-5-27 13:09
话说,楼主是某小主板厂的工程师?还是老板

硬件领域混饭吃的,有时候也接触服务器领域的东西。
发表于 2024-5-27 13:27 | 显示全部楼层
archxm 发表于 2024-5-27 12:48
玩家比英特尔的工程师更懂 cpu

玩家懂不懂我不知道 反正作为最近四代都买了的I9用户 我能确定英特尔不懂。
发表于 2024-5-27 13:46 | 显示全部楼层
kmdkai 发表于 2024-5-27 13:18
这位兄弟说的比较专业有一些道理,想必也是经历过很多折腾之人啊。

人类早期驯服野生14900KS珍贵经验。
发表于 2024-5-27 13:48 | 显示全部楼层
houyuzhou 发表于 2024-5-27 13:27
玩家懂不懂我不知道 反正作为最近四代都买了的I9用户 我能确定英特尔不懂。 ...

牙膏厂懂CPU,但不懂主板。
理论上,如果主板能准确按照牙膏厂的vid去供电,是不会出问题的。
实际上,现有的供电是有延迟的,还会出现瞬时高压和瞬时低压。瞬时高压多了就缩缸,瞬时低压就崩溃死机。
发表于 2024-5-27 14:01 | 显示全部楼层
qveydjdy 发表于 2024-5-27 12:25
LGA1700的CPU SOCKET电压超过1.3V 频率超过5.5G就开始失控

我的139ks,在华硕z板上,socket电压,电压见过1.45v,负载越高反而越低
发表于 2024-5-27 14:37 | 显示全部楼层
星辰柯博文 发表于 2024-5-27 13:48
牙膏厂懂CPU,但不懂主板。
理论上,如果主板能准确按照牙膏厂的vid去供电,是不会出问题的。
实际上,现 ...

高情商:intel的U太先进了,市面 上能根据负载、频率对应的 适配精准电压的主板都太拉胯了,主板厂调不好,放开功耗墙,不限制ICCmax都是你们板厂的锅

低情商:谈灰烬就不要跟我谈稳定,你们消费者 真是钱少事多,有事主板厂,无事 阴特尔?
发表于 2024-5-27 14:45 来自手机 | 显示全部楼层
星辰柯博文 发表于 2024-5-27 12:57
低压太低,高压太高,中间波动范围过大。
在不限制电流的情况下,149KS R15电流可达400A以上,此时出现严重 ...

应该是这个问题,所以连续烤鸡出现问题都是两个测试循环短暂衔接间出现的,温度一下高一下低,好像以前有大大测试过,AMD的睿频机制比英特尔好。
发表于 2024-5-27 14:48 | 显示全部楼层
星辰柯博文 发表于 2024-5-27 12:57
低压太低,高压太高,中间波动范围过大。
在不限制电流的情况下,149KS R15电流可达400A以上,此时出现严重 ...

有点好奇,定频定压这件事很low吗,就我身边的朋友5.3-5.8(看体质) 定频定压用的没见过有啥问题的,难道就因为设置相对无脑,不符合diy的风格吗
发表于 2024-5-27 15:00 | 显示全部楼层
支持一下勇士 不论出发点是什么。。。
发表于 2024-5-27 15:42 | 显示全部楼层
听君一席话 如听一席话
发表于 2024-5-27 16:39 | 显示全部楼层
TVB Voltage Optimizationsoffset149k0.1v
发表于 2024-5-27 17:13 | 显示全部楼层
我现在直接用core voltage suspension 把电压的上下限都锁死了。波动只有最大波动只有0.02v
不知道这么干什么副作用没有,但是我感觉还挺方便的,也不用设置什么acll了。
比如149ks定频5.8,那我就直接celling设置为1.33 floor设置为1.32。实际hwinfo里的vcore电压就一直1.32左右。不管是打游戏、看视频还是跑r23亦或者是待机,各种负载下,他都一直这个电压
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2024-7-20 16:51 , Processed in 0.015110 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表