找回密码
 加入我们
搜索
      
查看: 1133|回复: 52

[显卡] 【新时代双卡交火】新手双显卡插帧折腾分享

[复制链接]
发表于 2025-8-18 14:28 | 显示全部楼层 |阅读模式
本帖最后由 秦南瓜 于 2025-8-18 16:17 编辑

Part1 我对于目前多倍帧生成的基本认知

DLSS
最近50系玩了一圈,对dlss4的x4帧生成有了比较全面的体验。
我是4k240的屏(后面我也只说4k的情况了),个人觉得4k下至少5070ti起步,x4帧生成是相当可用的,支持dlss4的3A都能在x4插帧下获得不错的体验。所谓锦上添花正是如此了
多帧生成本来就会占用一小部分性能,基础帧不满60的情况下开启多帧生成会导致帧数降到50多,一些高负载场景就会跌到40多,此时操作延迟会变得很大,体验非常拉跨。
所以5070ti再往下的sku,4k下基本都需要降特效来凑足核心性能跑满60+的基础帧,或者是去凑不爆显存的图形设置。

AFMF
amd的卡我玩的不太多,也基本上买了跑完测试就出了。本代玩了9070xt和9070,上代只玩了7900xtx。
afmf刚出来的时候,我用7900xtx测了下2077下afmf的情况,不太能用。。延迟大,看着帧数高,操作贼卡。后来就没咋折腾a卡。
前几个月amd驱动实装了afmf2.1我用手头9070xt测了下2077,体验好太多了,个人体感性能开销和画面质量基本和dlss3 x2插帧没啥差异了。
但这玩意也只能x2,没有更多倍数可选。最新的9070xt也是只能x2,这方面和dlss差出了一个身位,期待一下后续多倍的afmf


小黄鸭
那么不支持多帧生成的显卡呢?比如30系,或者不支持afmf的A卡,以及更老的显卡。那只能靠 小黄鸭Lossless Scaling 了。
小黄鸭steam有售,十几块钱买的,是个通用插帧工具,可以对视频之类的多媒体插帧,当然也可以对游戏进行插帧。这边只说游戏了。

小黄鸭插帧LSFG3.1不像dlss3 dlss4,只有可以开启无边框窗口的游戏可以使用,一些老旧的dx11全屏游戏就不能插帧画面会卡住。其插帧的性能开销明显更大,且开启插帧的时候拖动画面伪影更明显(或者说40系50系对插帧做了架构优化?降低了插帧的性能开销)
就拿我手头的3090举例,4k下2077 dlss transformer 性能档 不开光追,光栅设置拉满,帧数勉勉强强可以60~70+
此时打开小黄鸭x2插帧。基础帧会骤降到50内。打开x3 x4或更高倍数,插帧的性能开销提高,基础帧会被压得更低。看着帧数一百多,操作延迟巨大,这就是不可用的状态。
但如果基础帧足够的话,小黄鸭插帧确实是可以大幅提升流畅度的,插帧倍数设置在x4以内的话,操作延迟也不会太大(这玩意插帧倍数可以自定义,几百倍也能整,就是没法用)

所以总结一下,在基础帧足够(≥60fps)的前提下
dlss4插帧仍然最先进,支持x2 x3 x4插帧,画面质量也最高。
afmf2.1其次,只支持x2插帧。
小黄鸭LSFG3.1画面质量最差(甚至它还有进一步劣化插帧画质换取性能的选项),性能开销最大,但好就好在它通用,且什么显卡都能用。


Part2 新时代双卡交火--双卡怎么插帧?
那当然是:一张卡负责渲染,一张卡负责插帧。两张显卡必须都插在直连cpu的pcie槽位,负责渲染游戏的卡插在pcie1(距离cpu最近的那个槽),负责插帧的显卡接显示器输出画面(这样延迟最低)

这个玩法出来有段时间了,我在搜索教程&资料的时候也搜到chh有坛友分享过
双卡插帧afmf和小黄鸭都可以玩,afmf就是限定插帧卡为支持afmf的A卡,且只能x2插帧。
当然了,这个玩法优势和劣势都很明显,但整体折腾过程还是很有趣的。
因为小黄鸭不会限定插帧卡类型,也不限制插帧倍数。我这篇帖子接下来就单说小黄鸭的玩法了

先说劣势:
1,主板必须有两条直连cpu的pcie x16槽位,且主板的pcie版本以及显卡支持的pcie版本越高越好(直连cpu的pcie带宽越大越好)。这一点会卡死很多主板。
2,两条pcie的间隔还不能太窄,负责渲染的显卡因为插在上面,如果两个槽位间隔太窄,结合目前显卡巨大的体积,负载渲染的那张卡会窒息,没法正常进风&散热。这一点会进一步卡死很多主板。
3,因为渲染卡必须插在距离cpu最近的那个槽,注定会吸收下方插帧卡的废热,也就是吸尾气。插帧卡须尽量选择低功耗的显卡,或者干脆选otes涡轮卡热量排出机箱不给渲染卡吸尾气。这一点会筛选掉很多高功耗的显卡。

再说优势:
1,插帧不再占用渲染显卡的性能,将性能开销转移到专门负责插帧的显卡上面。渲染卡跑多少帧,实际插帧直接渲染帧数翻倍或者多倍,且帧生成更加稳定。
2,利好垃圾佬,一些便宜的显卡作为插帧卡,插帧性能还相当不错。
3,利好垃圾佬,双卡插帧的方案下。渲染卡可以选择一些没有视频输出的计算卡,搭配低价插帧卡,实现性价比最大化。
4,利好垃圾佬,双卡插帧的方案适合x99这类便宜且pcie管够的平台。
我作为一个爱捡垃圾的pcdiyer,那这东西就很好玩了

硬件选择
1,主板选择
这块考虑到尽可能提高直连pcie带宽,以及我手头已有的硬件。最后选择了具备双卡pcie5.0*8,两条直连cpu的pciex16间隔四槽的C9H
2,渲染卡选择
现代显卡以及比较新的3a大作,基本都会有两个重要的功能,超分&插帧。
我是4k屏,超分当然很重要,原生4k没多少卡跑得动。目前超分仍然是DLSS的画面质量最优秀,所以我用了3090和4070s这两张支持dlss的pcie4.0显卡作为渲染卡测试。
为什么不选支持pcie5.0的新卡呢?当然是手头暂时没有合适的。。另外就是太贵了。。
3,插帧卡选择
这一趴我参考了小黄鸭论坛网友整理的表,表头的三个分辨率的含义是:作为插帧卡在这三个分辨率下最高可渲染的帧数。
由这两张表可见,同价位下,不看渲染,单看插帧,AMD显卡的插帧性能显著高于N卡。
微信图片_20250818102815.jpg
微信图片_20250818102808.jpg

Part3 实操测试
测试平台:
AMD 9700x,性能足够满足双卡插帧方案的需求
C9H(双卡pcie5.0*8,两条直连cpu的pciex16间隔四槽),
渲染卡:RTX3090 FE,RTX4070Super FE
插帧卡:RTX3090 FE,RTX4070Super FE,RX5700XT,VEGA FE,MTT S80,9700x亮机核显
win11 24h2,只有win11可以支持小黄鸭指定gpu插帧
win11显示设置里面图形设置指定高性能显卡为渲染卡,小黄鸭当中指定gpu为插帧卡。
测试游戏:赛博朋克2077  

测试之前,再明确下折腾的目的,或者说,本次折腾要解答我的什么问题?
我细想了下,两个问题:
1,双卡插帧方案操作延迟是否可接受?具备实用性吗?如果在可用范围的话,效果好吗?
2,已知单卡情况下,4070s开启x2插帧,和小黄鸭是可以插帧叠加的,但延迟巨大。那么双卡插帧的方案下,双插帧叠加是否可以把延迟降低到可用的范围?

OK,万事俱备,带着问题开搞。

c9h 两根四槽间隔的pciex16,这板子我就是为了折腾双卡插帧买的。。。
c9h.jpg

3090fe主卡渲染,4070s负责插帧
c9h-DC.jpg

win11 显示设置,指定3090为高性能显卡,也就是游戏之类的由3090渲染
3090.jpg

小黄鸭设置如图,指定4070s为插帧GPU,显示器得连在4070s上
4070s.jpg

3090 4k下2077 dlss transformer 性能档 不开光追,光栅设置拉满,帧数勉勉强强可以60~70+
75.jpg

小黄鸭四倍插帧,启动!!!
很棒,渲染帧率无衰减,直接75不打折扣x4
画面流畅,虽然快速移动,物体边缘还略微有瑕疵。。
但操作没什么可感知的延迟,个人感觉流畅度和dlss4四倍插帧没啥差异了,完全可用!甚至蛮好用的。
x2.jpg

那么接下来,4070s作为主卡,3090插帧,4070s开启x2 dlss插帧,3090继续四倍插帧。
emmmm延迟还是很大。我小黄鸭改了x3 x2插帧,延迟仍然不可接受。
插帧再叠加插帧,这东西延迟果然没啥办法。没法用,这个方案放弃了~
dlss ls.jpg

其他显卡测试
后面我还测了RX5700XT,VEGA FE,MTT S80,9700x亮机核显来插帧,但是没拍图。我就简单说下吧。
4070s fe,最高支持4k 310帧的插帧输出,比论坛那张插针性能表上240帧的数据高出一大截。。估计提供4070s数据的那个网友主板的pcie配置不太给力,或者他没插在直连cpu的槽。
RX5700XT 公版,最高支持4k 213帧插帧输出,基本符合那张性能表4k200帧的数据。也就是无论小黄鸭插帧倍数调得再怎么高,最高也就就213帧了,反而插帧倍数越高,系统会根据输出的帧数反向压缩渲染帧数。   700块的5700xt,能满足4k200帧插帧,真香!
vega fe,最高支持 4k 170帧插针输出,基本符合那张性能表vega64的4k160帧数据,性价比和5700xt差不多吧。。也很便宜
mtt s80,《国潮显卡》 这卡之前测了游戏仍然很残废,这次寻思着插帧能不能有奇效。结果给我气笑了。4k插帧输出最高40多帧。。。。。就出现了左上角小黄鸭侦测渲染/插帧帧率 60/45的奇观。继续回盒躺着吧。
9700x亮机核显,嗯,意料之中的没法用,4k直接输出很流畅。但是一开插针只剩十几帧了。果然插帧运算还是很吃核心算力的。

其他卡只拍了张双FE的照,因为比较好看
fex2.jpg


Part4 总结
最后回到两个问题
1,双卡插帧方案操作延迟是否可接受?具备实用性吗?如果在可用范围的话,效果好吗?

很好,完全可用,体验甚至有点棒。我这台机器后面就长期双卡了。真的很有趣!

2,已知单卡情况下,4070s开启x2插帧,和小黄鸭是可以插帧叠加的,但延迟巨大。那么双卡插帧的方案下,双插帧叠加是否可以把延迟降低到可用的范围?

不行,插帧叠插帧延迟还是太爆炸了,感知相当明显。这方案毙了


更新一个小黄鸭设置方面重要的点
设置帧生成倍数的时候一定要记得:你的渲染基础帧*倍数 一定要< 插帧卡的极限插针帧率。
比如rx5700 4k190帧的插帧极限性能,你的渲染卡跑游戏帧数60,这时候你设置插帧倍数只能x3最多了(60*3 < 190)
如果你设置x4, 插帧帧率会顶着190,反而会反向压低你的渲染帧率到190/4 也就是基础帧会从60压到47.5。
这时画面以及操作都会出现明显卡顿和延迟。影响实际体验。


以上。
以后我应该还会再在这个帖子更新一些别的显卡插帧的数据。

评分

参与人数 5邪恶指数 +140 收起 理由
momoka + 10 支持分享
andy0449 + 10 顶一下群友
beckcppes + 100
绿茵豪门 + 10 辛苦~ 谢谢分享~
坚决不中毒 + 10 就是NB

查看全部评分

发表于 2025-8-18 14:34 | 显示全部楼层
感觉很可用,不过受限于主板,不知道如果非直连cpu的话延迟会有多大衰减
 楼主| 发表于 2025-8-18 14:35 | 显示全部楼层
本帖最后由 秦南瓜 于 2025-8-18 14:45 编辑
天道太酬勤 发表于 2025-8-18 14:34
感觉很可用,不过受限于主板,不知道如果非直连cpu的话延迟会有多大衰减


我在b站看到个老哥,插帧卡插南桥的槽。延迟不太行。。不好用

我还看到有人用直连cpu的m2接口转接出来pcie槽插副卡,也可以用
发表于 2025-8-18 14:37 | 显示全部楼层
可以用N卡渲染叠A卡输出AFMF
 楼主| 发表于 2025-8-18 14:40 | 显示全部楼层
万鬼Zero 发表于 2025-8-18 14:37
可以用N卡渲染叠A卡输出AFMF

part2开头写了,afmf目前限定a卡&只能x2,所以我还是折腾的小黄鸭
发表于 2025-8-18 14:40 来自手机 | 显示全部楼层
插眼学习
发表于 2025-8-18 14:44 | 显示全部楼层
自用7900xtx和9070xt,游戏设定在120帧,开启帧生成的话延迟度都能接受,但是显卡基本使用率都是100%,设定在60帧就安静又温和了,适合3A玩家。
 楼主| 发表于 2025-8-18 14:46 | 显示全部楼层
SeanXmx 发表于 2025-8-18 14:44
自用7900xtx和9070xt,游戏设定在120帧,开启帧生成的话延迟度都能接受,但是显卡基本使用率都是100%,设定 ...

游戏的时候显卡占用100%很正常,这是应该的。如果显卡占用低于99%什么的,说明cpu或者内存瓶颈了。。
发表于 2025-8-18 14:59 来自手机 | 显示全部楼层
所以你为啥不试试smooth motion呢?那用着体感是比afmf2.1和小黄鸭都强的
 楼主| 发表于 2025-8-18 15:02 | 显示全部楼层
pingji 发表于 2025-8-18 14:59
所以你为啥不试试smooth motion呢?那用着体感是比afmf2.1和小黄鸭都强的

smooth motion我试过哦,所谓老黄鸭,效果不错的
但是限定40系及以上的N卡对垃圾佬来说不太友好

同样的,它也只能x2插帧。

而小黄鸭双卡插帧,只要插帧卡够强,可以胜任x4甚至更多倍数的插帧,效果能摸到dlss4 x4插帧的屁股了。上限是更高的
发表于 2025-8-18 15:07 | 显示全部楼层
非常感谢楼主分享,感觉十分有用,收藏学习。

按照楼主的测试结果,我认为可以把过程简单总结为:
①准备两张显卡:高性能独立显卡A、中等性能独立显卡B;
②准备一张主板,至少有2条PCIe插槽都直连CPU,两条插槽的带宽越高越好;
③Win11版本升级到24H2或更高;
④显卡A安装在直连CPU插槽1,Windows设置→系统→屏幕→显示卡→高级图形设置,默认高性能GPU:显卡A;
⑤显卡B安装在直连CPU插槽2,显示器线需要接在显卡B,小黄鸭配置文件,GPU/显示器→首选的GPU:显卡B。
发表于 2025-8-18 15:13 | 显示全部楼层
挺好玩的, 可惜没有两个cpu直连pcie的主板
 楼主| 发表于 2025-8-18 15:15 | 显示全部楼层
雨降花落 发表于 2025-8-18 15:07
非常感谢楼主分享,感觉十分有用,收藏学习。

按照楼主的测试结果,我认为可以把过程简单总结为:

是的,总结的没错
发表于 2025-8-18 15:17 | 显示全部楼层
不错啊,可惜我是itx主机,没办法两张卡
 楼主| 发表于 2025-8-18 15:18 | 显示全部楼层
terryhux 发表于 2025-8-18 15:17
不错啊,可惜我是itx主机,没办法两张卡

二奶机三奶机,捡垃圾搞起来
发表于 2025-8-18 15:24 | 显示全部楼层
i卡有没有这种玩法,例如a380/b850去做插帧卡
 楼主| 发表于 2025-8-18 15:28 | 显示全部楼层
本帖最后由 秦南瓜 于 2025-8-18 15:30 编辑
pp8848 发表于 2025-8-18 15:24
i卡有没有这种玩法,例如a380/b850去做插帧卡


有的,你看帖子里面插针性能对照表,下方有intel显卡的数据,就是a380插针性能有点弱。。。
发表于 2025-8-18 15:30 | 显示全部楼层
大佬牛逼。。。。
发表于 2025-8-18 15:34 来自手机 | 显示全部楼层
太牛了! 正好我手里有一张为了平时画图用rx5700和渲染用4070的x670e carbon
发表于 2025-8-18 15:37 | 显示全部楼层
本帖最后由 a_skywalker 于 2025-8-18 15:43 编辑

刚好前段时间拿Dell Mobile Precision 5490试了一下小黄鸭插帧。配置是Ultra 9 185H,64G LPDDR5X 7467,RTX 3000 Mobile Ada显卡(规格等同于RTX 4070 Mobile,但TDP最大只给了50W且完全不可调),只有混合输出模式,没有独显直连。
这个机器的最大问题是只给了130W的私有协议供电,感谢Dell的调校,单烤CPU能到110W,单烤显卡只有50W,然后双烤时CPU和显卡分别只给到了30W和35W的功耗,只有130W供电的一半,也就意味着CPU和显卡同时工作时Type-C能提供的大量功耗被浪费了,而市面上某些机器烤机时还能超过供电功率,当然只要从电池偷电就行了。不过考虑到这是个工作站级别的机器,所以保守就保守点吧。这就是我想搞插帧的起因——显卡的性能释放严重受到功耗墙的限制。

测试结果嘛,3A游戏,受限于功耗,RTX 3000 Ada很多时候跑不到60帧,加上补帧原始帧就更低了,这时候操作延迟非常明显,几乎不可用。考虑到一来Meteor Lake-H的核显规格较高,二来该笔记本没有独显直连,刚好可以测试独显渲染,集显补帧加输出,三来小黄鸭3.0后大幅改善了Intel核显的效率,所以我就拿来双卡交火了。我最初的想法是如果原始帧能跑40帧,加上小黄鸭2X补帧就可以到70帧左右,这样就能极大的弥补显卡只给了35W的缺陷,然而结果其实并不比独显单独补帧好多少,延迟虽然降了,但要达到可用的程度依然需要原始帧速能过60,锁40补70事实上依旧不太可用。可能是核显依旧太拉,加上带宽限制,所以表现不佳。

所以想通过小黄鸭来弥补帧数缺陷还是得原始帧率够高才行,实际操作没法弥补显卡功耗墙的限制,但对于高刷屏是绝对的利好。

结论就是:别指望这玩意儿能雪中送炭,人家是用来锦上添花的。
发表于 2025-8-18 15:38 | 显示全部楼层
terryhux 发表于 2025-8-18 15:17
不错啊,可惜我是itx主机,没办法两张卡

想办法还是可以的
发表于 2025-8-18 15:39 | 显示全部楼层
话说插帧卡超频的话有没有帮助?
发表于 2025-8-18 15:40 | 显示全部楼层
terryhux 发表于 2025-8-18 15:17
不错啊,可惜我是itx主机,没办法两张卡

OCULINK接一张显卡,只是需要一个M2槽。
发表于 2025-8-18 15:41 | 显示全部楼层
秦南瓜 发表于 2025-8-18 15:28
有的,你看帖子里面插针性能对照表,下方有intel显卡的数据,就是a380插针性能有点弱。。。 ...

780M的核显,应该也能搞吧。
 楼主| 发表于 2025-8-18 15:45 | 显示全部楼层
kaiwenwu 发表于 2025-8-18 15:39
话说插帧卡超频的话有没有帮助?

有的,极限插帧帧数可以略微提高。。。
 楼主| 发表于 2025-8-18 15:47 | 显示全部楼层
a_skywalker 发表于 2025-8-18 15:37
刚好前段时间拿Dell Mobile Precision 5490试了一下小黄鸭插帧。配置是Ultra 9 185H,64G LPDDR5X 7467,RT ...

是的,我在帖子中反复强调了。基础帧至少60

尤其小黄鸭,这东西性能开销确实比dlss fg和afmf高
 楼主| 发表于 2025-8-18 15:47 | 显示全部楼层
bloodwar 发表于 2025-8-18 15:41
780M的核显,应该也能搞吧。

可以尝试下,我手头没有。核心规格还是弱了点
 楼主| 发表于 2025-8-18 15:51 | 显示全部楼层
tim6252 发表于 2025-8-18 15:34
太牛了! 正好我手里有一张为了平时画图用rx5700和渲染用4070的x670e carbon

rx5700的4k极限插帧帧率在190~200

设置帧生成倍数的时候记得:你的渲染基础帧*倍数 一定要< 极限插针帧率。
比如rx5700 4k190帧的插帧极限性能,你4070游戏帧数60,这时候你设置插帧倍数x3最多了。
60*3 < 190。如果你设置x4, 插帧帧率会顶着190,这时候会反向压低你的渲染帧率到190/4 也就是基础帧会从60压到47.5。这时画面以及操作都会出现明显卡顿和延迟。影响体验。
发表于 2025-8-18 15:57 来自手机 | 显示全部楼层
秦南瓜 发表于 2025-8-18 15:51
rx5700的4k极限插帧帧率在190~200

设置帧生成倍数的时候记得:你的渲染基础帧*倍数 一定要< 极限插针帧 ...

感谢,我准备只弄2k就行了,显示器是144的,只是想解决4070自己独立跑ue5游戏最多6-70帧左右,然后开插针100出头,能感知到一点延迟(因为是射击游戏,比arpg这些会敏感点,特别是low帧波动大的时候)。这不是想着独立插针卡避免占用4070计算影响low帧来改善延迟,来顶满显示器的2k144就满足了
发表于 2025-8-18 15:58 来自手机 | 显示全部楼层
秦南瓜 发表于 2025-8-18 15:02
smooth motion我试过哦,所谓老黄鸭,效果不错的
但是限定40系及以上的N卡对垃圾佬来说不太友好


小黄鸭用过,比d4差远了尤其是延迟上,5080开sm和fg已经有d4x4的水准了,有reflex也能保证延迟没必要玩什么小黄鸭。
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-8-18 20:25 , Processed in 0.012772 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表