找回密码
 加入我们
搜索
      
查看: 21146|回复: 67

[显卡] [3.31更新完]手动统计ADA GPU体质 (逆向NV超频算法,感谢PPXG提示)

[复制链接]
发表于 2023-3-29 12:19 | 显示全部楼层 |阅读模式
本帖最后由 T.JOHN 于 2023-4-2 10:10 编辑

如果你有兴趣,可以自行贡献自己数据,此腾讯文档每个人均可编辑(并不用担心瞎改,有备份)

update 4.1.2023 14:00

用3070跑了一遍,并统计了数据,验证了之前的结论都是正确的

update 3.31.2023 20:15

感谢PPXG提示GFE和afterburner工作原理相同,给予我启发,因此昨天半夜花了几个小时基本搞清了如下内容。

感谢楼下回复数据的CHH众网友,判定体质只用新的额定电压下(ada应该是1.05v)数据比较科学,如果有时间大家可以更新下。

此贴目始终如一,找到一组可比的数据用于鉴定体质,可行性和算法我已经验证过了,数据见下文

1. 解析GFE/Afterburner工作原理
前言:GFE/Afterburner做的事情是一样的,相同的电压档位和非常接近的频率量程(误差1-2档)。afterburner只是调用NV驱动的API来测试,但afterburner输出结果没GFE稳定。不过这并不重要,读完本文即便你不知道结果,你也能手动绘制和GFE一模一样的VF curve,因为你已经掌握了NV工程师设计的逻辑。

这里先放一张afterburner扫描的点图,你可以和后面GFE的比较,没什么本质区别。


GFE的调试工作本质分为三步:
第一步,扫描VID的额点电压和频率点,RTX3070是1.075v,4090是1.05v。如果你拉满电压100%,那么4090就是1.1v。
第二步,从50%+GPU负荷开始,由低到高扫描4组电压的可用频率范围(参考下图),最后得到一条新的VF曲线。由于每15mhz一测,会比较耗时,总共花费25~30分钟。
随着电压升高,GPU负载可能会下降,原因可能是NV为了不触发温度墙影响boost扫描。
RTX4090
扫描电压
0.89
0.94
0.99
1.05
对应负载
50%
50%
50%
1%
RTX3070
扫描电压
0.706
0.812
0.943
1.075
对应负载
56%
50%
25%
1%
第三步,在4组电压测试完后,会进行拉满TGP的进行压力测试,以确保散热没问题。比如4090在855mv/2250mhz的重负载测试。

在第三步中,我们可以观察到目前NV boost机制为:在不触发功耗墙/温度墙的情况下,如果在某一个电压下运行超过VID的频率,则进入下一档VID的电压/频率,直到触发功耗墙为止,反之亦然。

这句话不能理解的话可以用下图帮助理解(假设不触发温度墙没问题)
a.) GPU运行在某个电压点,比如900mv,此时频率为A点
b). 如果在VF曲线下部/也不到功耗墙,它就会尝试运行在更高频率到B点(瞬态)
c). 到达超过VF曲线的B点后,还不到功耗墙,它就会升一档电压至C点,直至撞功耗墙
d). 反过来也是一样的,重载降频,频率小于VF曲线前一级时,降压提频率。D->E(瞬态)->F

有人问为什么不运行在B点省电又同频率呢?因为显卡boost机制受VF曲线控制。如果你想运行在B点,就需要调整VF曲线,世人称之为超频,又叫降压超频。
因此脱离VID超频或直接offset都可能不稳定。如果是简单粗暴拉一条直线,不触发功耗墙的情况下,它会往高的电压档位走去撞墙,但又不提频,纯属浪费电。

事实上打游戏是跑不满GPU负载的,即便你看上去GPU load 100%。而真正100% GPU load情况下,855mv/2250mhz就直接拉满TDP了。
这就好比CPU开启了AVX512时候跑P95的100% load和跑SSE 100% load完全两个概念,后者频率更高,甚至功耗大大下降。所以你并不用担心加压会损坏硬件,因为有功耗墙的存在,满载(CUDA全工作)你大概率跑在低电压档位。

2. 逆向NV超频算法
所有逆向过程都在这张图中,下文一一进行解释,数据分别来源于GPU-Z后台记录log和GFE调整完以后打开Afterburner显示的offset值(第三列黄色高亮部分)

一. GFE输出和测量范围的逆向分析
由于GFE只调试了4组电压下的工作频率。根据工程常识,这4组电压对应的输出是“测量值”,其他都是计算值。我们先关注这4组测量值,也就是蓝色和金色部分。
可以看到,GFE输出值实际上是它从测试起点到测试终点这个范围的(金色高亮部分)中位数(注意起跳测量点>=VID,不是=VID),也就是说它还留了一半的超频余量,显然这就很稳。它测试退出的那个频率点推测应该是不稳定/稳定的临界点(红圈所示),否则它会继续试下去。

二. 新VF curve线性内插的逆向分析
上文提到除了测量值还需要用计算方法补全其它电压点以生成新的曲线,这种工程方法一般都是线性内插,至于是内插哪个值,是我们要寻找的。
我开始以为有了频率即可直接使用频率进行内插,算下来显然不对,因为这样完全抛弃了VID,想想也不靠谱。然后就用offset值验算了一遍猜想,则完全正确。第三列是GFE跑完以后的生成值,第六列是我计算的值,两者完全一样。

三. 验证GFE给出的offset值含义
既然offset值是不固定的,通过4个点位线性内插完成的。GFE最终给的+xxxmhz究竟指的是什么?显然需要一个解释。我猜测就是所有offset点的算数平均,计算结果是117.4(最下面深绿高亮部分)和GFE输出的117一致。

至此我们完美解释了每一个数值的意义,逆向解释完毕,明白了GFE的VF curve的计算逻辑。即取固定电压下测试频率的中间值,用offset线性内插,完成0.89~1.05v的新curve。

3. 需要统计的数据

明白了GFE的原理我们应该如何查看体质呢?很显然,每个电压的最终退出点才是我们要的“体质”。如果你要降压超频,可以参考低档位电压GFE测试的最大频率往下降。

新的统计数据需要的是1.05v下退出测试的频率值,即最后一次测试值。

step1. 打开gpu-z或hwinfo64的记录功能,开始跑GFE自动超频调试
step2. 使用excel/记事本打开日志,查看1.05v进行测量的最后一个频率值
注:若不用日志,也可以看屏幕记录。大约GFE进度条到80%~90%以后,显示电压1.1v(1.05v显示为1.1v)最后一个频率值就是体质参考值。在这个频率值后,会跑满TDP进行散热测试,明显听到风扇声。

GFE误差会有多大?
从上文可以看到,它每15mhz跳一档(15mhz应该是NV时钟发生器的最小单位,),GPU占用率50%,不撞温度墙,不撞功耗墙,理论没有误差。从数学角度而言,他的误差最大也就15mhz。而实际扫描时每一档位的退出频率完全保持一致,不会跳到下一个15mhz的档位。

不足之处:
1. 跑GFE比较费时,20~30分钟,很多人未必有耐心
2. 未统计1.1v极限体质,因为GFE默认不会测到1.1v,只有把电压拉满才会测到1.1v

综上所述,我相信大家应该已经学会了NV工程师的逻辑,知道如何利用VID自制VF曲线并且找到手动超频可参考的极限频率  Enjoy!



由于显卡不方便像CPU看分,大家也不知道自己是雕还是雷。CPU看分的逻辑,是通过VID给SP分。根据相同原理,只需要CHH玩家贡献点数据,自然可以知道GPU的SP分数。有至少需要30个VID样本,再做个正态分布曲线排序,即可得结果,当然样本是越多越好。

操作流程如下,
1. 打开msi afterburner,点curve,看下自己的VID,记录下0.9v,0.95v,1v,1.05v,1.1v对应频率。这个理解为厂家预设值,举个例子如下:
0.9 - 2400mhz
0.95 - 2600mhz
1.0 - 2700mhz
1.05 - 2800mhz
1.1 - 2900mhz
注:VID在统计上还是有意义的,尤其样本越大意义越大

2. 打开GFE -> 有个性能评估,参考8楼截图。GFE作为NV第一方调试工具,可以保持结果一致性和可靠性。由于需要20~30分钟左右测试,而且不能做其他事情,建议泡杯咖啡,或者afk时候测。建议使用GPU-Z开启log功能以记录最后一次频率值,参考上文

GFE测试的电压范围大约是0.89~1.05v。在调试的时候,你会看到频率/电压/功耗(但电压只有小数点后1位,请打开GPU-Z或者HWinfo64得到准确电压),最终输出个offset,+xxx mhz。

3. 记录下自己的显卡型号和TGP,由于各家各型号给的功耗各不相同,给高点显然可能会影响GFE tuning后的频率。功耗不影响GFE结果,这条错误。

一般极限超频的工况是1.1v的频率,额定工况是1.05v的频率,降压超频的人士典型选择是0.95v/1v这两档,这些频率统计后都会有其各自意义
如果想要降压超频,请使用GPU-Z的log功能记录GFE扫描时上图红圈的频率值,即每个电压档位最后一个扫描频率,酌情减少30mhz(15x2)~60mhz(15x4)。
如果测1.1v下的超频极限,需要调整GFE的电压设置,拉满10%。

一方面老黄标榜自己ada能跑3G,每片可雕,而另一方面又有人指责新4090限1.07v电压,颗颗是雷。与其争论,不如统计,得到更准确的结果。这方面互联网上是没有数据的,这里由CHH首度发起,每一位会员都可参与贡献。


update 3/30/2023:

我们的目的是绘制体质分布,自然需要一组具备可比性的数据,通过统计学得到最后准确的结果。前提就是要设定合理的边界条件,用合理的工程采样手段,并且可以复现和验证。而不是找到可以通过3Dmark某个测试的极限频率,目的不同的工作没有任何可比性。

Q1:为什么不用3Dmark测试?
A2:它不能输出精确可比较的结果。
     1. 3Dmark只是一个benchmark software,而不是hardware tuning tool。
     2. 每次过3Dmark测试未必是一个频率,它受温度影响较大,并且玩家校验过3Dmark测试的频率也不能精确到15mhz(GFE可以)。
     3. 3Dmark有些时候画面有点小花屏但是能过测试并且出分,显然可以主观隐瞒导致数据失真,不算是完全的客观测量。
     4. 过了3Dmark也不一定能过其他游戏,它不是稳定性的权威。

Q2:为什么用GFE?
A2:1. 他虽然是个黑匣子,但它是第一方诊断工具,而非一个测试软件。根据NV自己的算法,完成一个闭环测试,给出一个相对稳定的超频数值,无作弊可能。
     2. 一方面他给的offset值要比afterburner oc scan来得大,也就是更极限,但不会搞坏你的硬件,另一方面他输出的结果仅仅是一个数值,方便统计。理论上afterburner给出的曲线也可以用来对比,但是不方便统计。reddit用户基本上测出成绩后直接导入afterburner用,因为GFE不超显存。
     3. 一致性好。GFE的测试可以节省时间,一次通过即可,当然保底的20分钟是要的。它不需要像3Dmark一样反复跑,看通过/不通过。最终给出的这个值是“保守”的,不是极限超频值,基本是可以稳定使用的,最重要的是NV自己算法的判定标准是一致的。
     4. 受干扰程度低(温度影响小),可复现性强。GFE测试只有最后一个阶段跑满功耗,不会因为温度墙而损失频率。因此测量条件不苛刻,结果不容易失真,这样的数据更有可比性。不像某些超频结果在夏天缩肛,就无法比较了。我反复测量误差基本在0-3mhz,非常非常小,可以认为没有。

已知@取个名字真是难,@AllenHRZ,@LLCF 三位都是4090FE,vbios版本是一样的,但vid不一样。

评分

参与人数 3邪恶指数 +90 收起 理由
beckcppes + 20 太屌了
skanlife + 50 赞美科学家
某人的马甲 + 20 666

查看全部评分

发表于 2023-3-29 12:30 | 显示全部楼层
本帖最后由 AxIaTErN 于 2023-3-29 12:34 编辑

1.1    - 2835
1.05  - 2745
1.0    - 2640
0.95  - 2475
0.9    - 2265

pny的4080,GFE没装,TGP 320w
发表于 2023-3-29 12:41 | 显示全部楼层
0.9   - 2220mhz
0.95 - 2445mhz
1.0   - 2595mhz
1.05 - 2715mhz
1.1   - 2790mhz

4080FE,GFE没装
发表于 2023-3-29 13:24 来自手机 | 显示全部楼层
预设值相同型号的卡 都是一样的吧...要测体质应该是测0.9V 1V 1.05V能到最高频率。其实直接截个小飞机里的曲线图更快 还能直接对比整个曲线的区别
发表于 2023-3-29 13:31 | 显示全部楼层
晚上回家更新我的数据。

顺便问下有无CPU看分逻辑的联动贴
发表于 2023-3-29 13:34 | 显示全部楼层
没我们30的事,告辞
发表于 2023-3-29 23:02 | 显示全部楼层
0.90v - 2265
0.95v - 2475
1.00v - 2625
1.05v - 2730
1.10v - 2805

七彩虹4090
发表于 2023-3-29 23:13 | 显示全部楼层
4090FE:
0.90v - 2355
0.95v - 2550
1.00v - 2685
1.05v - 2775
1.10v - 2850
QQ截图20230329211312.jpg
发表于 2023-3-29 23:17 | 显示全部楼层
本帖最后由 绿茵豪门 于 2023-3-29 23:20 编辑

不知道这个的意义在那里 这个根本看不出体质的....

最多能知道每家的BIOS设置的曲线......

要看体质 就直接跑3DMARK PR 然后看最大频率你1.1V 多少能过
发表于 2023-3-30 00:15 | 显示全部楼层
0.90v - 2340
0.95v - 2535
1.00v - 2670
1.05v - 2775
1.10v - 2850
魔鹰 4090
发表于 2023-3-30 01:10 来自手机 | 显示全部楼层
绿茵豪门 发表于 2023-3-29 23:17
不知道这个的意义在那里 这个根本看不出体质的....

最多能知道每家的BIOS设置的曲线......

正解,我超龙无X 1.05对应2745,火神oc 1.05对应2775,朋友的猛禽 1.05对应2850。但三张卡超频上限都比较接近(超龙3.15,火神3.1,猛禽3.09)根本说明不了体质,没有参考意义。
发表于 2023-3-30 01:40 来自手机 | 显示全部楼层
SuperLac 发表于 2023-3-30 01:10
正解,我超龙无X 1.05对应2745,火神oc 1.05对应2775,朋友的猛禽 1.05对应2850。但三张卡超频上限都比较 ...

上限3.0的羡慕流泪,还好显存可以+2000
发表于 2023-3-30 01:42 来自手机 | 显示全部楼层
另外正版crash of us 变4090超频质检员了,gpu的稳定频率比pr 和 port rtx 还要再拉低30到50mhz.
发表于 2023-3-30 01:43 | 显示全部楼层
我的4090猛禽,1.1v TSE最高3030mhz过测
发表于 2023-3-30 01:44 | 显示全部楼层
轻似梦 发表于 2023-3-30 01:43
我的4090猛禽,1.1v TSE最高3030mhz过测

心态瞬间好很多,谢谢兄弟猛禽。
发表于 2023-3-30 08:55 | 显示全部楼层
SuperLac 发表于 2023-3-30 01:10
正解,我超龙无X 1.05对应2745,火神oc 1.05对应2775,朋友的猛禽 1.05对应2850。但三张卡超频上限都比较 ...

差不多  我的超龙原厂bios风冷下 极限也是3150 实际上刷hofbios应该能表现更好
 楼主| 发表于 2023-3-30 09:31 | 显示全部楼层
本帖最后由 T.JOHN 于 2023-3-30 11:26 编辑
AxIaTErN 发表于 2023-3-29 12:30
1.1    - 2835
1.05  - 2745
1.0    - 2640


感谢贡献,不过单有VID,但没有GFE的数据就失去可比性了,还是建议有条件跑一遍,不想留的跑完删了即可。

同时感谢3,7,8,10楼的分享,除了8楼建议有条件都补测一下GFE的数据。
发表于 2023-3-30 09:56 | 显示全部楼层
每家BIOS的上限跟显卡体质没关系啊。。。还是需要手动升压/降压以及+-频率跑稳定


我运气比较好,4090魔鹰,默认1.05V能跑3GHZ,目前降压到0.95V  2750mhz,都跑过稳定测试了。显存是直接+1500在用,一直很稳,没敢再往上超了,留点富余。
发表于 2023-3-30 22:37 | 显示全部楼层
本帖最后由 PPXG 于 2023-3-30 22:41 编辑

TUF4090 非OC
0.90v - 2250
0.95v - 2445
1.00v - 2580
1.05v - 2685
1.10v - 2775

oc scanner是玄学 我跑过好几次就没一个一样的,而且有时候差异巨大,调优后的VF曲线甚至不如全默认

另外我严重怀疑TUF非OC的VF曲线有问题,我看了几个非OC的实际频率满载都跑在2670MHz左右,明显低于FE和其他没有出厂预超频的丐中丐的频率(一般为2760Mhz),但是GPUZ的base clock和boost clock与他们一致,实际手动超频上去的话似乎也没什么问题。。。。
 楼主| 发表于 2023-3-30 23:15 | 显示全部楼层
PPXG 发表于 2023-3-30 22:37
TUF4090 非OC
0.90v - 2250
0.95v - 2445

主贴我更新了下,应该不会,我用GFE跑了很多遍,只要温度不太过分,基本误差最多0-3Mhz。你是用afterburner跑的oc vf curve么?那个我没记录过,GFE比较傻瓜,方便我统计数据。
发表于 2023-3-30 23:33 | 显示全部楼层
T.JOHN 发表于 2023-3-30 23:15
主贴我更新了下,应该不会,我用GFE跑了很多遍,只要温度不太过分,基本误差最多0-3Mhz。你是用afterburn ...

GFE自动调优和小飞机的oc scanner其实是一个东西,GFE的跑完也可以在小飞机里看到类似的VF曲线变动。没记错的话GFE跑出来是+70~90之间浮动
发表于 2023-3-31 00:49 | 显示全部楼层
T.JOHN 发表于 2023-3-30 09:31
感谢贡献,不过单有VID,但没有GFE的数据就失去可比性了,还是建议有条件跑一遍,不想留的跑完删了即可。 ...

没找到GFE性能评估选项,软件叫geforce experience么?
发表于 2023-3-31 04:11 | 显示全部楼层
貌似并没有什么用,我30系的时候就试过...那时候好歹扫描的还是1.081v的,上限也就1.09v。几张30扫出来offest最低反而是最能超的那张。
现在扫描的是1.05v吧,那和1.1v差的更多了.
20230331040847.png
发表于 2023-3-31 04:14 | 显示全部楼层
跑个portal rtx关dlss试试?
发表于 2023-3-31 08:33 | 显示全部楼层
我这个七彩虹的4070ti 自己设置的佛系最高频率是0.99v 2805mhz,基本用200-220瓦的功耗维持了默认性能 很高效凉快
发表于 2023-3-31 08:38 | 显示全部楼层
有了GPU boost 2.0之后出厂即灰烬,实际工作的boost频率就是在功耗、安全电压限制和良率保证下能跑的最高频率,自己不加压再超频就是把原厂留的稳定余量吃完,再加压就是牺牲芯片寿命换一点点频率提升
发表于 2023-3-31 09:46 | 显示全部楼层
你这是要弄F-V曲线啊,不过一样的ASIC,每个厂商每个产品的FV曲线会有不同,至少A卡是这样,看个大概是可以的
发表于 2023-3-31 10:13 | 显示全部楼层
beckcppes 发表于 2023-3-30 01:40
上限3.0的羡慕流泪,还好显存可以+2000

我倒挺想要显存+2000甚至2500的 我1500就纹理错误了
发表于 2023-3-31 19:28 | 显示全部楼层
fighte97 发表于 2023-3-31 10:13
我倒挺想要显存+2000甚至2500的 我1500就纹理错误了

我可以拉1700,但跑分和我拉1400没区别
发表于 2023-3-31 21:01 | 显示全部楼层
顶一顶,我也想知道GPU sp分怎么算
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-4-26 18:00 , Processed in 0.018580 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表