找回密码
 加入我们
搜索
      
查看: 8987|回复: 6

[电脑] RX 7900 XT这款5K价位的性价比游戏卡,目前跑AI应用性能又如何呢?

[复制链接]
发表于 2024-4-17 08:39 | 显示全部楼层 |阅读模式
本帖最后由 Rogerhuling 于 2024-4-17 08:38 编辑

测试硬件和配置
对于游戏玩家来说,选择AMD显卡往往会更有性价比,那么随着目前AI渗透式爆发增长,AMD显卡在这方面表现到底又如何呢?是不是也具备性价比?我们今天就来探讨一下,值得一提的是,本篇内容会分为AIGC(AI生成内容)和LLM(大语言模型)这两个最备受关注的AI领域进行测试。

454.jpg

测试之前,不得不提一下AMD ROCm(开放式软件堆栈),它的概念类似于NVIDIA CUDA,广泛应用于LLM(大语言模型)、自动驾驶、机器学习等领域,AMD ROCm在Ubuntu系统(Linux)中支持相当成熟,而在去年四月份AMD正式推出ROCm For Windows,如今已完整支持RX 6800以上的AMD消费级显卡,硬核就用手上的RX 7900 XT捣鼓一番吧。

8.jpg

测试显卡来自定位次旗舰的蓝宝石RX 7900 XT超白金OC L,外观采用银灰色金属导流罩+单侧灵动岛RGB灯条设计,拥有七根镀镍热管、全铜底座、铝镁合金框架等豪华用料,是AMD高端非公版的代表之作。

1.jpg

配合AI测试的处理器是锐龙 7 7700X,使用微星MAG B650M MORTAR WIFI迫击炮组成3A平台,主板外观采用低调风格的纯黑主题打造,散热马甲上还有拉丝效果处理很精致,它还采用了12+2相供电,服务于CPU的MOS最大电流支持到80A,应付最高端的锐龙9都不成问题。

2.jpg

压制锐龙7 7700X的CPU散热器是微星MEG CORELIQUID S360战神,定位旗舰360水冷,整体由采用纯黑性能风扇+2.4英寸IPS显示屏组成,水泵方案来自老伙计Asetek七代,冷头上还内置了一个60mm风扇,可以为主板周边散热。

3.jpg

为了驱动锐龙7 7700X和RX 7900 XT的高端组合,配备了来自微星的MPG A1000G PCIE5电源,它最大的亮点就是兼容PCIe 5.0和ATX 3.0标准,拥有原生12VHPWR 16pin供电接口,最高可输出600W,加上本身拥有10年质保售后,可很好适配现今及未来的旗舰显卡。

CCCCCC.png

其他硬件和配置方面,锐龙7 7700X直接开启PBO技术,使用EXPO超频达成DDR5 6000C34 16G*4,总计64GB内存容量,本次测试安装的是AMD Adrenalin 24.3.1最新版本显卡驱动(中间有加入去年23.11.1版本的简单测试环节),操作系统是Windows 11 23H2版本,最后在BIOS中开启Resizable BAR技术提升一些显卡性能。




Stable Diffusion不同分辨率出图性能

HIP SDK.png

首先来测试一下目前最为火热的AIGC应用——Stable Diffusion AI绘画,目前对于AMD显卡来说有好几种部署形式,简单来分析一下吧。

第一种是DirectML SDK,插件支持不错,效率是最低的,有整合包。

第二种是通过Microsoft Olive转换成ONNX,效率挺高的,但插件支持不完善,部署起来繁琐。

第三种是Ubuntu系统+AMD ROCm,效率和兼容是最好的,不过部署同样繁琐,也不是大部分普通用户熟悉的Windows系统。

第四种就是最近比较流行的ZLUDA插件,效率仅次于第三种,也有整合包更适合大部分普通用户,本文就以这种形式进行测试的。

huis.png

ZLUDA插件部署很简单,只要下载最新版本的绘世整合包,安装前置的AMD HIP SDK(不需要安装专业版显卡驱动),就可以在整合包界面——生成引擎这里看到ZLUDA已经部署完毕,下面来看看Stable Diffusion AI绘画六种设置的测试结果。

AbyssOrangeMix2深渊橙模型

正向提示词:1girl,long hair,pink hair,game game cg,full body,best quality,masterpiece,realistic,8K wallpaper,beautiful and aesthetic,detailed background

反向提示词:nsfw,ugly,low quality,low res,bad bad proportions,EasyNegative,missing arms,extra legs,too many fingers,extra arms and legs,text,username

采样方法:DPM++ 2M Karras

迭代步进:20

512.png

分辨率设置:512X512,总批次:1,单批数量:1,RX 7900 XT出图用时2.6秒

768.png

分辨率设置:768X768,总批次:1,单批数量:1,RX 7900 XT出图用时7.4秒

1024.png

分辨率设置:1024X1024,总批次:1,单批数量:1,RX 7900 XT出图用时18.5秒

1920.png

分辨率设置:1920X1080,总批次:1,单批数量:1,RX 7900 XT出图用时1分5秒

1024 3-6.png

分辨率设置:1024X1024,总批次:3,单批数量:6,RX 7900 XT出图用时5分16秒

RX 7900 XT在ZLUDA加持下,各分辨率出图情况都还不错,尤其是基础的单张512X512,在体感上就是秒出,单张1024X1024设置以下能在20秒内完成,而且还可以支持到1920X1080这种分辨率。结论显而易见,ZLUDA插件是目前A卡在Windows系统下的最优解方案,它兼容性和效率都不错。

1024 3-6-ZHANY.png

在1024X1024分辨率项目中,RX 7900 XT甚至可以实现一批次生成六张图,分成三个批次进行也没有任何问题,显存只用到17GB,20GB大显存当然是绰绰有余,可以实现多线操作,能跑起来才是王道嘛。

512 s.png

硬核还测试了去年12月份的AMD Adrenalin 23.11.1显卡驱动,结果是和目前最新版本没什么大区别,唯一就是旧驱动在首次使用ZLUDA编译会更慢一些,对于现阶段AMD显卡来说,完善Stable Diffusion的各种插件生态才是首要重心了,尤其是在Windows环境下的AMD ROCm支持。



Topaz Video AI基准测试

videon  ai.png

第二个AIGC应用则是Topaz Video AI,硬核经常用它来修复一些低分辨率的“粤语残片”,下面来简单看看RX 7900 XT在输入1080P分辨率的基准跑分。

1080P.png

RX 7900 XT输入分辨率1080P,各项模型的跑分性能

在Topaz Video AI常用的四个模型——插帧方面的修复常用模型是Apollo和Chronos,而图像方面的修复常用模型是Proteus和Gaia,从测试结果来看,RX 7900 XT用来修复1080P分辨率视频效率相当不错,跑起来就是入门级显卡的好几十倍了,20GB大显存海量储备足够可以喂饱。



Mistral-7B和通义千问1.5-14B/32B/72B四种大模型性能测试

lm.png

第三个测试项目是LM Studio,这是一款可搜索并下载在本地运行LLM(大语言模型)的应用,并可兼容OpenAI API的接口,它省去了Python复杂的配置过程,也是免费开源的,重点它是本地部署,可以更好保护个人隐私。

LM Studio对于AMD硬件也是相当友好,现今拥有支持锐龙处理器NPU硬件加速(包含AMD OpenCL)和AMD ROCm显卡加速的两种软件版本,对于RX 6800以上的AMD显卡来说,强烈推荐后者版本,效率完全不是一个概念,下面来看看RX 7900 XT运行7B、14B、32B、72B四种不同参数量的大模型效能如何吧。

7B.png

Mistral-7B,RX 7900 XT使用AMD ROCm加速,推荐GPU负载数值MAX,推理速度为83.39 tok/s

13B.png

通义千问1.5-14B,RX 7900 XT使用AMD ROCm加速,推荐GPU负载数值MAX,推理速度为66.91 tok/s

32B.png

通义千问1.5-32B,RX 7900 XT使用AMD ROCm加速,推荐GPU负载数值MAX,推理速度为31.48 tok/s

72B.png

通义千问1.5-72B,RX 7900 XT使用AMD ROCm加速,推荐GPU负载数值40,推理速度为3.01 tok/s

首先,在上述答案中,可以看到模型的参数量越大,AI回答的令人满意程度就越高,而在运行72B参数量时(至少是能跑起来),由于远远超出了RX 7900 XT的负载能力,偶尔AI回答有时候会抽风,正常的时候和32B参数量用起来没什么区别。而32B参数量回答问题的体感也是秒回,AI生成文字的速度稍微比7B慢一丢丢,完全是不影响爽快体验的。

32B.png

通义千问1.5-32B,RX 7900 XT使用AMD ROCm加速,GPU负载可以用到90%以上,显存则是15GB,可以充分把显卡性能榨干了,再次证明20GB大容量显存的优势之处,硬核比较好奇的是,如果是16GB显存的显卡,性能表现又会如何呢?

72b.png

通义千问1.5-72B,对于RX 7900 XT来说,GPU负载数值是不能超过40的,否则就会出现报错警告,运行它时内存占用达到36GB,但是效率却上不去,这种恐怖如斯的参数量,一般都是多张专业卡才能跑得爽了。


结语

5.jpg

目前AMD RX 7900 XT这款显卡售价在5K价位,它在游戏性能方面可以比肩RTX 4080 SUPER了,性价比是相当高的,而经过本文实测,RX 7900 XT在AIGC(AI生成内容)和LLM(大语言模型)领域的性能表现,完全是对得起它的售价,它拥有20GB GDDR6X超大显存容量,可以运行一些数据量更大的项目,我们也看到了AMD ROCm在Windows系统中可以发挥强大的AI算力,期待AMD可以继续加大优化的力度吧!总得来说,RX 7900 XT是挺适合追求性价比的游戏玩家和AI专业用户。

评分

参与人数 3邪恶指数 +35 收起 理由
toddler + 10
TernenceS + 15
hudizhoutube + 10

查看全部评分

发表于 2024-4-17 10:58 | 显示全部楼层
论游戏,确实很有性价比
发表于 2024-4-17 11:04 | 显示全部楼层
amd的显卡,希望功耗方面降低,看齐英伟达。
 楼主| 发表于 2024-4-17 11:30 | 显示全部楼层
蓝雪 发表于 2024-4-17 10:58
论游戏,确实很有性价比

每一样都给你最好的,你让隔壁家怎么卖?
发表于 2024-4-17 14:41 来自手机 | 显示全部楼层
希望越来越好,有竞争才行
发表于 2024-4-17 20:08 | 显示全部楼层
测试画面是太极宗师吧?
发表于 2024-6-8 20:02 | 显示全部楼层
想知道7900XT 2K分辨率出图效率怎样?跟4070TI S 相比
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-4-25 13:45 , Processed in 0.010886 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表