QSV/DG2 vs NVENC/Turing 硬件编码器质量对比 2022

Misaka_9993 发表于 2022-10-24 19:31

本帖最后由 Misaka_9993 于 2022-10-24 19:43 编辑

NVEnc/QSVEnc/VCEEnc的作者 rigaya 7月份从京东海淘了一块Intel Arc A380，
并用它和 RTX 2070 等做了一些硬件编码器的质量对比。这里挑选具有代表性的最高质量 quality 预设进行对比。

测试视频为1080p 29.97fps。对比的码率区间为1000~16000kbps，同比特率下SSIM值高者质量更佳。

使用的测试命令如下：
qsv H.264 (-u 1:quality, 4:normal)
--icq <x> -u <1,4>

qsv HEVC (-u 1:quality, 4:normal)
--icq <x> -u <1,4> -c hevc

qsv HEVC 10bit (-u 1:quality, 4:normal)
--icq <x> -u <1,4> -c hevc --profile main10 --output-depth 10

qsv H.264 FF (-u 1:quality, 4:normal)
--icq <x> -u <1,4> --fixed-func

qsv HEVC FF (-u 1:quality, 4:normal)
--icq <x> -u <1,4> --fixed-func -c hevc

qsv HEVC FF 10bit (-u 1:quality, 4:normal)
--icq <x> -u <1,4> --fixed-func -c hevc --profile main10 --output-depth 10

qsv AV1 FF (-u 1:quality, 4:normal)
--icq <x> -u <1,4> --level 5.2 --fixed-func -c av1

qsv AV1 FF 10bit (-u 1:quality, 4:normal)
--icq <x> -u <1,4> --level 5.2 --fixed-func -c av1 --output-depth 10

nvenc H.264
--vbrhq 0 --vbr-quality <x> --preset quality --weightp --bref-mode each --lookahead 32 --level 5.1

nvenc HEVC
--vbrhq 0 --vbr-quality <x> --preset quality --weightp --bref-mode each --lookahead 32 -c hevc --level 6 -b 3

nvenc HEVC 10bit
--vbrhq 0 --vbr-quality <x> --preset quality --weightp --bref-mode each --lookahead 32 -c hevc --level 6 --output-depth 10 -b 3

H.264 8bit:

HEVC、AV1 8bit:

HEVC、AV1 10bit:

结论是 DG2 的QSV H.264 H.265 硬件编码质量已经超过了 Turing NVENC，其中 QSV H.264 小幅优于 NVENC H.264，而 QSV H.265 则优势明显。
QSV AV1 编码器在低码率下质量优于 QSV H.265，高码率下 QSV H.265 仍然占优。

此外 DG2 的 QSV 在最高质量 quality 预设下，速度仍然优于 Turing NVENC，这一点核显做不到，只能在质量(EU)和速度(fixed-function)中选其一，详细数据请详见原blog：
https://rigaya34589.blog.fc2.com/blog-entry-1549.html

隔壁 RX6000 的 VCN3 AMF 由于过于拉跨，连 H.265 的 b 帧和 QVBR 预设都不支持，这里就不上镜了，有兴趣可自行浏览：
https://rigaya34589.blog.fc2.com/blog-entry-1574.html

RTX 4090 4080 新增了 AV1 编码，并拥有 2 个 NVENC 单元，速度上肯定有提升，但官方未提及编码质量提升，
希望 H.264 H.265 NVENC 编码质量不要原地踏步（因为RTX20 30已经连着用了两代Gen7 NVENC了。

zhgbbs 发表于 2022-10-24 19:35

cpu的都隐藏了吗，有没有和cpu的质量对比

kinglfa 发表于 2022-10-24 19:36

请教个事，之前看到12代牙膏的PPT说核显HD770的提升可以用作直播中编码，就是直播软件指定核显来做编码，和显卡互不耽误，不影响玩游戏的性能。
确实如此吗？HD770能推12000码率1080p@60Hz吗？

Misaka_9993 发表于 2022-10-24 19:38

zhgbbs 发表于 2022-10-24 19:35
cpu的都隐藏了吗，有没有和cpu的质量对比

没有和CPU软件编码比较的，没显示的是核显，它速度和质量不可兼得。

momo77989724 发表于 2022-10-24 19:41

果然是生产力工具啊[狂笑]

Misaka_9993 发表于 2022-10-24 19:41

kinglfa 发表于 2022-10-24 19:36
请教个事，之前看到12代牙膏的PPT说核显HD770的提升可以用作直播中编码，就是直播软件指定核显来做编码，和 ...

UHD770做这种事是很轻松的，用OBS里的QuickSync就行了。
不过12代牙膏核显不支持编码AV1，最高只能HEVC。

需要注意的是核显吃内存带宽，内存敏感型游戏仍然会有影响。

liusha1010 发表于 2022-10-24 19:43

上一代安培也是支持av1编码/解码，最近想洗版，不知道用哪个软件压出av1

Misaka_9993 发表于 2022-10-24 19:44

本帖最后由 Misaka_9993 于 2022-10-24 19:46 编辑

liusha1010 发表于 2022-10-24 19:43
上一代安培也是支持av1编码/解码，最近想洗版，不知道用哪个软件压出av1

记错了吧。RTX30安培只能解AV1，没法编。要编AV1只能上RTX40 Ada。

QSV AV1硬编码刚合并进ffmpeg主线，NVENC AV1还没有动静，至少再等个半年软件跟进吧。否则就用svt-av1软件编码咯。

liusha1010 发表于 2022-10-24 19:51

本帖最后由 liusha1010 于 2022-10-24 19:52 编辑

Misaka_9993 发表于 2022-10-24 19:44
记错了吧。RTX30安培只能解AV1，没法编。要编AV1只能上RTX40 Ada。

QSV AV1硬编码刚合并进ffmpeg主线，N ...

官方文档显示支持，右下角那个位置

Misaka_9993 发表于 2022-10-24 19:52

本帖最后由 Misaka_9993 于 2022-10-24 19:55 编辑

liusha1010 发表于 2022-10-24 19:51
官方文档显示支持

“+ AV1 decode”只能解不能编。

https://developer.nvidia.com/video-encode-and-decode-gpu-support-matrix-new

liusha1010 发表于 2022-10-24 19:54

本帖最后由 liusha1010 于 2022-10-24 19:55 编辑

Misaka_9993 发表于 2022-10-24 19:52
“+ AV1 decode”只能解不能编。

https://developer.nvidia.com/video-encode-and-decode-gpu-support-m ...

果然不能[睡觉]

aibo 发表于 2022-10-24 19:55

liusha1010 发表于 2022-10-24 19:51
官方文档显示支持，右下角那个位置

明显是只有decode才+了av1啊

yangzi123aaa20 发表于 2022-10-24 19:56

但是最常用的obs用的qsv还是上古版本，画质稀烂还不支持hevc[谩骂]

liusha1010 发表于 2022-10-24 19:56

aibo 发表于 2022-10-24 19:55
明显是只有decode才+了av1啊

大意了

pc_based 发表于 2022-10-24 19:56

从京东海淘可还行

Misaka_9993 发表于 2022-10-24 19:56

liusha1010 发表于 2022-10-24 19:54
果然不能

https://www.nvidia.com/en-us/geforce/graphics-cards/compare/

https://developer.nvidia.com/video-encode-and-decode-gpu-support-matrix-new

官网和开发者官网都写了RTX30不支持AV1 Encode，难不成你这个文档还能无中生有？

Misaka_9993 发表于 2022-10-24 19:59

pc_based 发表于 2022-10-24 19:56
从京东海淘可还行

那时候日本人买不着A380，只能从中国海淘[偷笑]

liusha1010 发表于 2022-10-24 20:02

本帖最后由 liusha1010 于 2022-10-24 20:04 编辑

Misaka_9993 发表于 2022-10-24 19:56
https://www.nvidia.com/en-us/geforce/graphics-cards/compare/

https://developer.nvidia.com/video-e ...

看走眼了，反正不割卵子~[狂笑]

斯登发表于 2022-10-24 20:06

顺便问一下，380和770对于hevc 10bit 422的硬解，是不是效果一样？

Misaka_9993 发表于 2022-10-24 20:09

本帖最后由 Misaka_9993 于 2022-10-24 20:10 编辑

斯登发表于 2022-10-24 20:06
顺便问一下，380和770对于hevc 10bit 422的硬解，是不是效果一样？

DG2从最低端的A310到最高端的A770，编解码引擎数量都是2个，没有阉割和限制，所以效果速度都一样。

单纯指HEVC 4:2:2解码。如果是渲染需要显存和EU数量，太少了速度肯定有影响。

斯登发表于 2022-10-24 20:12

Misaka_9993 发表于 2022-10-24 20:09
DG2从最低端的A310到最高端的A770，编解码引擎数量都是2个，没有阉割和限制，所以效果速度都一样。

单纯 ...

感谢回复，受教了，多谢

uuyyhhjj 发表于 2022-10-24 20:16

14代的核显估计能上AV1硬编码

liusha1010 发表于 2022-10-24 20:17

Misaka_9993 发表于 2022-10-24 20:09
DG2从最低端的A310到最高端的A770，编解码引擎数量都是2个，没有阉割和限制，所以效果速度都一样。

单纯 ...

请教一下，h.265编码，纯cpu编码和gpu编码画质差别大不大？TLF那边的int好像都是纯cpu编码

Misaka_9993 发表于 2022-10-24 20:40

liusha1010 发表于 2022-10-24 20:17
请教一下，h.265编码，纯cpu编码和gpu编码画质差别大不大？TLF那边的int好像都是纯cpu编码 ...

压制组没人用GPU编码的，个个都开了写轮眼，那是一帧一帧地修。就DG2这个质量的来看的话，自用和串流完全是绰绰有余了。

liusha1010 发表于 2022-10-24 20:45

Misaka_9993 发表于 2022-10-24 20:40
压制组没人用GPU编码的，个个都开了写轮眼，那是一帧一帧地修。就DG2这个质量的来看的话，自用和串流完全 ...

QSV/DG2/NVENC是对应图中的这三个吧？

Misaka_9993 发表于 2022-10-24 20:46

liusha1010 发表于 2022-10-24 20:45
QSV/DG2/NVENC是对应图中的这三个吧？

DG2是A380 A770这些intel独显的代号，它们支持QSV（QuickSync）。

AMD的VCE VCN和AMF是一个东西。

NV是NVENC。

aibo 发表于 2022-10-24 20:53

uuyyhhjj 发表于 2022-10-24 20:16
14代的核显估计能上AV1硬编码

牙膏说了，要把媒体这块功能集成到cpu中。

也许以后就不需要gpu来做这事了。

Misaka_9993 发表于 2022-10-24 21:04

aibo 发表于 2022-10-24 20:53
牙膏说了，要把媒体这块功能集成到cpu中。

也许以后就不需要gpu来做这事了。 ...

现在本来也不需要GPU来做编解码啊，MFX和SFC单元都是单独的一块，传统意义上的EU shader根本不需要动。问题就是intel想把这部分放在哪，放在CPU边上，就是所谓的“集成到CPU”中。

sc80t 发表于 2022-10-24 21:10

Misaka_9993 发表于 2022-10-24 20:09
DG2从最低端的A310到最高端的A770，编解码引擎数量都是2个，没有阉割和限制，所以效果速度都一样。

单纯 ...

那a310是好东西啊，这个做亮机卡不错

aibo 发表于 2022-10-24 21:18

Misaka_9993 发表于 2022-10-24 21:04
现在本来也不需要GPU来做编解码啊，MFX和SFC单元都是单独的一块，传统意义上的EU shader根本不需要动。问 ...

就是要集成在“cpu”里面，一直可用。

现在算是集成在集显里，关掉集显就用不了。

页: [1] 2 3 4

Chiphell - 分享与交流用户体验's Archiver

QSV/DG2 vs NVENC/Turing 硬件编码器质量对比 2022