Misaka_9993 发表于 2022-10-24 19:31

QSV/DG2 vs NVENC/Turing 硬件编码器质量对比 2022

本帖最后由 Misaka_9993 于 2022-10-24 19:43 编辑

NVEnc/QSVEnc/VCEEnc的作者 rigaya 7月份从京东海淘了一块Intel Arc A380,
并用它和 RTX 2070 等做了一些硬件编码器的质量对比。这里挑选具有代表性的最高质量 quality 预设进行对比。

测试视频为1080p 29.97fps。对比的码率区间为1000~16000kbps,同比特率下SSIM值高者质量更佳。

使用的测试命令如下:
qsv H.264 (-u 1:quality, 4:normal)
--icq <x> -u <1,4>

qsv HEVC (-u 1:quality, 4:normal)
--icq <x> -u <1,4> -c hevc

qsv HEVC 10bit (-u 1:quality, 4:normal)
--icq <x> -u <1,4> -c hevc --profile main10 --output-depth 10

qsv H.264 FF (-u 1:quality, 4:normal)
--icq <x> -u <1,4> --fixed-func

qsv HEVC FF (-u 1:quality, 4:normal)
--icq <x> -u <1,4> --fixed-func -c hevc

qsv HEVC FF 10bit (-u 1:quality, 4:normal)
--icq <x> -u <1,4> --fixed-func -c hevc --profile main10 --output-depth 10

qsv AV1 FF (-u 1:quality, 4:normal)
--icq <x> -u <1,4> --level 5.2 --fixed-func -c av1

qsv AV1 FF 10bit (-u 1:quality, 4:normal)
--icq <x> -u <1,4> --level 5.2 --fixed-func -c av1 --output-depth 10

nvenc H.264
--vbrhq 0 --vbr-quality <x> --preset quality --weightp --bref-mode each --lookahead 32 --level 5.1

nvenc HEVC
--vbrhq 0 --vbr-quality <x> --preset quality --weightp --bref-mode each --lookahead 32 -c hevc --level 6 -b 3

nvenc HEVC 10bit
--vbrhq 0 --vbr-quality <x> --preset quality --weightp --bref-mode each --lookahead 32 -c hevc --level 6 --output-depth 10 -b 3

H.264 8bit:


HEVC、AV1 8bit:


HEVC、AV1 10bit:



结论是 DG2 的QSV H.264 H.265 硬件编码质量已经超过了 Turing NVENC,其中 QSV H.264 小幅优于 NVENC H.264,而 QSV H.265 则优势明显。
QSV AV1 编码器在低码率下质量优于 QSV H.265,高码率下 QSV H.265 仍然占优。

此外 DG2 的 QSV 在最高质量 quality 预设下,速度仍然优于 Turing NVENC,这一点核显做不到,只能在质量(EU)和速度(fixed-function)中选其一,详细数据请详见原blog:
https://rigaya34589.blog.fc2.com/blog-entry-1549.html

隔壁 RX6000 的 VCN3 AMF 由于过于拉跨,连 H.265 的 b 帧和 QVBR 预设都不支持,这里就不上镜了,有兴趣可自行浏览:
https://rigaya34589.blog.fc2.com/blog-entry-1574.html

RTX 4090 4080 新增了 AV1 编码,并拥有 2 个 NVENC 单元,速度上肯定有提升,但官方未提及编码质量提升,
希望 H.264 H.265 NVENC 编码质量不要原地踏步(因为RTX20 30已经连着用了两代Gen7 NVENC了。

zhgbbs 发表于 2022-10-24 19:35

cpu的都隐藏了吗,有没有和cpu的质量对比

kinglfa 发表于 2022-10-24 19:36

请教个事,之前看到12代牙膏的PPT说核显HD770的提升可以用作直播中编码,就是直播软件指定核显来做编码,和显卡互不耽误,不影响玩游戏的性能。
确实如此吗?HD770能推12000码率1080p@60Hz吗?

Misaka_9993 发表于 2022-10-24 19:38

zhgbbs 发表于 2022-10-24 19:35
cpu的都隐藏了吗,有没有和cpu的质量对比

没有和CPU软件编码比较的,没显示的是核显,它速度和质量不可兼得。

momo77989724 发表于 2022-10-24 19:41

果然是生产力工具啊[狂笑]

Misaka_9993 发表于 2022-10-24 19:41

kinglfa 发表于 2022-10-24 19:36
请教个事,之前看到12代牙膏的PPT说核显HD770的提升可以用作直播中编码,就是直播软件指定核显来做编码,和 ...

UHD770做这种事是很轻松的,用OBS里的QuickSync就行了。
不过12代牙膏核显不支持编码AV1,最高只能HEVC。

需要注意的是核显吃内存带宽,内存敏感型游戏仍然会有影响。

liusha1010 发表于 2022-10-24 19:43

上一代安培也是支持av1编码/解码,最近想洗版,不知道用哪个软件压出av1

Misaka_9993 发表于 2022-10-24 19:44

本帖最后由 Misaka_9993 于 2022-10-24 19:46 编辑

liusha1010 发表于 2022-10-24 19:43
上一代安培也是支持av1编码/解码,最近想洗版,不知道用哪个软件压出av1

记错了吧。RTX30安培只能解AV1,没法编。要编AV1只能上RTX40 Ada。

QSV AV1硬编码刚合并进ffmpeg主线,NVENC AV1还没有动静,至少再等个半年软件跟进吧。否则就用svt-av1软件编码咯。

liusha1010 发表于 2022-10-24 19:51

本帖最后由 liusha1010 于 2022-10-24 19:52 编辑

Misaka_9993 发表于 2022-10-24 19:44
记错了吧。RTX30安培只能解AV1,没法编。要编AV1只能上RTX40 Ada。

QSV AV1硬编码刚合并进ffmpeg主线,N ...

官方文档显示支持,右下角那个位置





Misaka_9993 发表于 2022-10-24 19:52

本帖最后由 Misaka_9993 于 2022-10-24 19:55 编辑

liusha1010 发表于 2022-10-24 19:51
官方文档显示支持

“+ AV1 decode”只能解不能编。

https://developer.nvidia.com/video-encode-and-decode-gpu-support-matrix-new

liusha1010 发表于 2022-10-24 19:54

本帖最后由 liusha1010 于 2022-10-24 19:55 编辑

Misaka_9993 发表于 2022-10-24 19:52
“+ AV1 decode”只能解不能编。

https://developer.nvidia.com/video-encode-and-decode-gpu-support-m ...


果然不能[睡觉]

aibo 发表于 2022-10-24 19:55

liusha1010 发表于 2022-10-24 19:51
官方文档显示支持,右下角那个位置

明显是只有decode才+了av1啊

yangzi123aaa20 发表于 2022-10-24 19:56

但是最常用的obs用的qsv还是上古版本,画质稀烂还不支持hevc[谩骂]

liusha1010 发表于 2022-10-24 19:56

aibo 发表于 2022-10-24 19:55
明显是只有decode才+了av1啊

大意了            

pc_based 发表于 2022-10-24 19:56

从京东海淘可还行

Misaka_9993 发表于 2022-10-24 19:56

liusha1010 发表于 2022-10-24 19:54
果然不能

https://www.nvidia.com/en-us/geforce/graphics-cards/compare/

https://developer.nvidia.com/video-encode-and-decode-gpu-support-matrix-new

官网和开发者官网都写了RTX30不支持AV1 Encode,难不成你这个文档还能无中生有?

Misaka_9993 发表于 2022-10-24 19:59

pc_based 发表于 2022-10-24 19:56
从京东海淘可还行

那时候日本人买不着A380,只能从中国海淘[偷笑]

liusha1010 发表于 2022-10-24 20:02

本帖最后由 liusha1010 于 2022-10-24 20:04 编辑

Misaka_9993 发表于 2022-10-24 19:56
https://www.nvidia.com/en-us/geforce/graphics-cards/compare/

https://developer.nvidia.com/video-e ...

看走眼了,反正不割卵子~[狂笑]

斯登 发表于 2022-10-24 20:06

顺便问一下,380和770对于hevc 10bit 422的硬解,是不是效果一样?

Misaka_9993 发表于 2022-10-24 20:09

本帖最后由 Misaka_9993 于 2022-10-24 20:10 编辑

斯登 发表于 2022-10-24 20:06
顺便问一下,380和770对于hevc 10bit 422的硬解,是不是效果一样?

DG2从最低端的A310到最高端的A770,编解码引擎数量都是2个,没有阉割和限制,所以效果速度都一样。

单纯指HEVC 4:2:2解码。如果是渲染需要显存和EU数量,太少了速度肯定有影响。

斯登 发表于 2022-10-24 20:12

Misaka_9993 发表于 2022-10-24 20:09
DG2从最低端的A310到最高端的A770,编解码引擎数量都是2个,没有阉割和限制,所以效果速度都一样。

单纯 ...

感谢回复,受教了,多谢

uuyyhhjj 发表于 2022-10-24 20:16

14代的核显估计能上AV1硬编码

liusha1010 发表于 2022-10-24 20:17

Misaka_9993 发表于 2022-10-24 20:09
DG2从最低端的A310到最高端的A770,编解码引擎数量都是2个,没有阉割和限制,所以效果速度都一样。

单纯 ...

请教一下,h.265编码,纯cpu编码和gpu编码画质差别大不大?TLF那边的int好像都是纯cpu编码

Misaka_9993 发表于 2022-10-24 20:40

liusha1010 发表于 2022-10-24 20:17
请教一下,h.265编码,纯cpu编码和gpu编码画质差别大不大?TLF那边的int好像都是纯cpu编码 ...

压制组没人用GPU编码的,个个都开了写轮眼,那是一帧一帧地修。就DG2这个质量的来看的话,自用和串流完全是绰绰有余了。

liusha1010 发表于 2022-10-24 20:45

Misaka_9993 发表于 2022-10-24 20:40
压制组没人用GPU编码的,个个都开了写轮眼,那是一帧一帧地修。就DG2这个质量的来看的话,自用和串流完全 ...

QSV/DG2/NVENC是对应图中的这三个吧?

Misaka_9993 发表于 2022-10-24 20:46

liusha1010 发表于 2022-10-24 20:45
QSV/DG2/NVENC是对应图中的这三个吧?

DG2是A380 A770这些intel独显的代号,它们支持QSV(QuickSync)。

AMD的VCE VCN和AMF是一个东西。

NV是NVENC。

aibo 发表于 2022-10-24 20:53

uuyyhhjj 发表于 2022-10-24 20:16
14代的核显估计能上AV1硬编码

牙膏说了,要把媒体这块功能集成到cpu中。

也许以后就不需要gpu来做这事了。

Misaka_9993 发表于 2022-10-24 21:04

aibo 发表于 2022-10-24 20:53
牙膏说了,要把媒体这块功能集成到cpu中。

也许以后就不需要gpu来做这事了。 ...

现在本来也不需要GPU来做编解码啊,MFX和SFC单元都是单独的一块,传统意义上的EU shader根本不需要动。问题就是intel想把这部分放在哪,放在CPU边上,就是所谓的“集成到CPU”中。

sc80t 发表于 2022-10-24 21:10

Misaka_9993 发表于 2022-10-24 20:09
DG2从最低端的A310到最高端的A770,编解码引擎数量都是2个,没有阉割和限制,所以效果速度都一样。

单纯 ...

那a310是好东西啊,这个做亮机卡不错

aibo 发表于 2022-10-24 21:18

Misaka_9993 发表于 2022-10-24 21:04
现在本来也不需要GPU来做编解码啊,MFX和SFC单元都是单独的一块,传统意义上的EU shader根本不需要动。问 ...

就是要集成在“cpu”里面,一直可用。

现在算是集成在集显里,关掉集显就用不了。
页: [1] 2 3 4
查看完整版本: QSV/DG2 vs NVENC/Turing 硬件编码器质量对比 2022