QSV/DG2 vs NVENC/Turing 硬件编码器质量对比 2022
本帖最后由 Misaka_9993 于 2022-10-24 19:43 编辑NVEnc/QSVEnc/VCEEnc的作者 rigaya 7月份从京东海淘了一块Intel Arc A380,
并用它和 RTX 2070 等做了一些硬件编码器的质量对比。这里挑选具有代表性的最高质量 quality 预设进行对比。
测试视频为1080p 29.97fps。对比的码率区间为1000~16000kbps,同比特率下SSIM值高者质量更佳。
使用的测试命令如下:
qsv H.264 (-u 1:quality, 4:normal)
--icq <x> -u <1,4>
qsv HEVC (-u 1:quality, 4:normal)
--icq <x> -u <1,4> -c hevc
qsv HEVC 10bit (-u 1:quality, 4:normal)
--icq <x> -u <1,4> -c hevc --profile main10 --output-depth 10
qsv H.264 FF (-u 1:quality, 4:normal)
--icq <x> -u <1,4> --fixed-func
qsv HEVC FF (-u 1:quality, 4:normal)
--icq <x> -u <1,4> --fixed-func -c hevc
qsv HEVC FF 10bit (-u 1:quality, 4:normal)
--icq <x> -u <1,4> --fixed-func -c hevc --profile main10 --output-depth 10
qsv AV1 FF (-u 1:quality, 4:normal)
--icq <x> -u <1,4> --level 5.2 --fixed-func -c av1
qsv AV1 FF 10bit (-u 1:quality, 4:normal)
--icq <x> -u <1,4> --level 5.2 --fixed-func -c av1 --output-depth 10
nvenc H.264
--vbrhq 0 --vbr-quality <x> --preset quality --weightp --bref-mode each --lookahead 32 --level 5.1
nvenc HEVC
--vbrhq 0 --vbr-quality <x> --preset quality --weightp --bref-mode each --lookahead 32 -c hevc --level 6 -b 3
nvenc HEVC 10bit
--vbrhq 0 --vbr-quality <x> --preset quality --weightp --bref-mode each --lookahead 32 -c hevc --level 6 --output-depth 10 -b 3
H.264 8bit:
HEVC、AV1 8bit:
HEVC、AV1 10bit:
结论是 DG2 的QSV H.264 H.265 硬件编码质量已经超过了 Turing NVENC,其中 QSV H.264 小幅优于 NVENC H.264,而 QSV H.265 则优势明显。
QSV AV1 编码器在低码率下质量优于 QSV H.265,高码率下 QSV H.265 仍然占优。
此外 DG2 的 QSV 在最高质量 quality 预设下,速度仍然优于 Turing NVENC,这一点核显做不到,只能在质量(EU)和速度(fixed-function)中选其一,详细数据请详见原blog:
https://rigaya34589.blog.fc2.com/blog-entry-1549.html
隔壁 RX6000 的 VCN3 AMF 由于过于拉跨,连 H.265 的 b 帧和 QVBR 预设都不支持,这里就不上镜了,有兴趣可自行浏览:
https://rigaya34589.blog.fc2.com/blog-entry-1574.html
RTX 4090 4080 新增了 AV1 编码,并拥有 2 个 NVENC 单元,速度上肯定有提升,但官方未提及编码质量提升,
希望 H.264 H.265 NVENC 编码质量不要原地踏步(因为RTX20 30已经连着用了两代Gen7 NVENC了。 cpu的都隐藏了吗,有没有和cpu的质量对比 请教个事,之前看到12代牙膏的PPT说核显HD770的提升可以用作直播中编码,就是直播软件指定核显来做编码,和显卡互不耽误,不影响玩游戏的性能。
确实如此吗?HD770能推12000码率1080p@60Hz吗? zhgbbs 发表于 2022-10-24 19:35
cpu的都隐藏了吗,有没有和cpu的质量对比
没有和CPU软件编码比较的,没显示的是核显,它速度和质量不可兼得。 果然是生产力工具啊[狂笑] kinglfa 发表于 2022-10-24 19:36
请教个事,之前看到12代牙膏的PPT说核显HD770的提升可以用作直播中编码,就是直播软件指定核显来做编码,和 ...
UHD770做这种事是很轻松的,用OBS里的QuickSync就行了。
不过12代牙膏核显不支持编码AV1,最高只能HEVC。
需要注意的是核显吃内存带宽,内存敏感型游戏仍然会有影响。 上一代安培也是支持av1编码/解码,最近想洗版,不知道用哪个软件压出av1 本帖最后由 Misaka_9993 于 2022-10-24 19:46 编辑
liusha1010 发表于 2022-10-24 19:43
上一代安培也是支持av1编码/解码,最近想洗版,不知道用哪个软件压出av1
记错了吧。RTX30安培只能解AV1,没法编。要编AV1只能上RTX40 Ada。
QSV AV1硬编码刚合并进ffmpeg主线,NVENC AV1还没有动静,至少再等个半年软件跟进吧。否则就用svt-av1软件编码咯。 本帖最后由 liusha1010 于 2022-10-24 19:52 编辑
Misaka_9993 发表于 2022-10-24 19:44
记错了吧。RTX30安培只能解AV1,没法编。要编AV1只能上RTX40 Ada。
QSV AV1硬编码刚合并进ffmpeg主线,N ...
官方文档显示支持,右下角那个位置
本帖最后由 Misaka_9993 于 2022-10-24 19:55 编辑
liusha1010 发表于 2022-10-24 19:51
官方文档显示支持
“+ AV1 decode”只能解不能编。
https://developer.nvidia.com/video-encode-and-decode-gpu-support-matrix-new
本帖最后由 liusha1010 于 2022-10-24 19:55 编辑
Misaka_9993 发表于 2022-10-24 19:52
“+ AV1 decode”只能解不能编。
https://developer.nvidia.com/video-encode-and-decode-gpu-support-m ...
果然不能[睡觉]
liusha1010 发表于 2022-10-24 19:51
官方文档显示支持,右下角那个位置
明显是只有decode才+了av1啊 但是最常用的obs用的qsv还是上古版本,画质稀烂还不支持hevc[谩骂] aibo 发表于 2022-10-24 19:55
明显是只有decode才+了av1啊
大意了 从京东海淘可还行 liusha1010 发表于 2022-10-24 19:54
果然不能
https://www.nvidia.com/en-us/geforce/graphics-cards/compare/
https://developer.nvidia.com/video-encode-and-decode-gpu-support-matrix-new
官网和开发者官网都写了RTX30不支持AV1 Encode,难不成你这个文档还能无中生有? pc_based 发表于 2022-10-24 19:56
从京东海淘可还行
那时候日本人买不着A380,只能从中国海淘[偷笑] 本帖最后由 liusha1010 于 2022-10-24 20:04 编辑
Misaka_9993 发表于 2022-10-24 19:56
https://www.nvidia.com/en-us/geforce/graphics-cards/compare/
https://developer.nvidia.com/video-e ...
看走眼了,反正不割卵子~[狂笑] 顺便问一下,380和770对于hevc 10bit 422的硬解,是不是效果一样? 本帖最后由 Misaka_9993 于 2022-10-24 20:10 编辑
斯登 发表于 2022-10-24 20:06
顺便问一下,380和770对于hevc 10bit 422的硬解,是不是效果一样?
DG2从最低端的A310到最高端的A770,编解码引擎数量都是2个,没有阉割和限制,所以效果速度都一样。
单纯指HEVC 4:2:2解码。如果是渲染需要显存和EU数量,太少了速度肯定有影响。 Misaka_9993 发表于 2022-10-24 20:09
DG2从最低端的A310到最高端的A770,编解码引擎数量都是2个,没有阉割和限制,所以效果速度都一样。
单纯 ...
感谢回复,受教了,多谢 14代的核显估计能上AV1硬编码 Misaka_9993 发表于 2022-10-24 20:09
DG2从最低端的A310到最高端的A770,编解码引擎数量都是2个,没有阉割和限制,所以效果速度都一样。
单纯 ...
请教一下,h.265编码,纯cpu编码和gpu编码画质差别大不大?TLF那边的int好像都是纯cpu编码 liusha1010 发表于 2022-10-24 20:17
请教一下,h.265编码,纯cpu编码和gpu编码画质差别大不大?TLF那边的int好像都是纯cpu编码 ...
压制组没人用GPU编码的,个个都开了写轮眼,那是一帧一帧地修。就DG2这个质量的来看的话,自用和串流完全是绰绰有余了。 Misaka_9993 发表于 2022-10-24 20:40
压制组没人用GPU编码的,个个都开了写轮眼,那是一帧一帧地修。就DG2这个质量的来看的话,自用和串流完全 ...
QSV/DG2/NVENC是对应图中的这三个吧?
liusha1010 发表于 2022-10-24 20:45
QSV/DG2/NVENC是对应图中的这三个吧?
DG2是A380 A770这些intel独显的代号,它们支持QSV(QuickSync)。
AMD的VCE VCN和AMF是一个东西。
NV是NVENC。 uuyyhhjj 发表于 2022-10-24 20:16
14代的核显估计能上AV1硬编码
牙膏说了,要把媒体这块功能集成到cpu中。
也许以后就不需要gpu来做这事了。 aibo 发表于 2022-10-24 20:53
牙膏说了,要把媒体这块功能集成到cpu中。
也许以后就不需要gpu来做这事了。 ...
现在本来也不需要GPU来做编解码啊,MFX和SFC单元都是单独的一块,传统意义上的EU shader根本不需要动。问题就是intel想把这部分放在哪,放在CPU边上,就是所谓的“集成到CPU”中。 Misaka_9993 发表于 2022-10-24 20:09
DG2从最低端的A310到最高端的A770,编解码引擎数量都是2个,没有阉割和限制,所以效果速度都一样。
单纯 ...
那a310是好东西啊,这个做亮机卡不错 Misaka_9993 发表于 2022-10-24 21:04
现在本来也不需要GPU来做编解码啊,MFX和SFC单元都是单独的一块,传统意义上的EU shader根本不需要动。问 ...
就是要集成在“cpu”里面,一直可用。
现在算是集成在集显里,关掉集显就用不了。