AMD AI MAX+ 395AI的核显AI算力比rtx50系列高吗?

monei 发表于 2025-10-18 14:41

AMD AI MAX+ 395AI的核显可以使用96g内存作为显存, 那么这个核显的AI 算力比rtx50系列的显卡高很多,是吗?
刚接触到AI 大模型, 不太了解这一块, 所以问问大家.

真不易 发表于 2025-10-18 14:55

我也好奇，所以帮你问了下豆包：
在运行 DeepSeek 70B 模型时，RTX 5090 和 AMD AI MAX+ 395 各有优势。
从生成速度来看，RTX 5090 表现更优。实测数据显示，RTX 5090 在 DeepSeek R1-70B 模型上的生成速度达 45 tokens/s。而 AMD AI MAX+ 395 运行 DeepSeek R1 llama 70B 的生成速度为 3.55 tok/sec，运行 DeepSeek R1 qwen 32b 的速度为 8.91 tok/sec。不过，AMD AI MAX+ 395 在运行内存密集型的 AI 任务时，拥有高达 128GB 的统一内存，可将其中高达 96GB 分配为 VRAM。而 RTX 5090 的显存只有 32GB，在一些对显存容量要求极高的场景下可能会受到限制。

真不易 发表于 2025-10-18 14:56

这样看来，5090的32GB显存的算力，要远远大于395AI的算力。

自挂东南枝 发表于 2025-10-18 15:02

并不是，395的ai算力和显存带宽都不如5090，但显存容量大，在你的模型+上下文大于32G（或许更大一些）的时候，综合带宽就比5090大了（因为5090只有32G显存，大于32G的部分受限于pcie带宽了），这种情况下5090会受限于带宽导致ai性能骤减。
不过还有一点，其实395在跑这么大模型的时候速度也很慢，几乎不可用，395比较适合跑moe模型。（需要大显存，但算力需求小）

tim6252 发表于 2025-10-18 15:17

小水管超高流速VS大水管小流速

kanshuderen 发表于 2025-10-18 15:29

除非爆显存。。。不然完全不是一个量级的。。。。。

uprit 发表于 2025-10-18 15:41

你问算力啊？什么水管不水管的，那不叫算力。算力就是FLOPS，至于是FP32的还是FP16的甚至FP4的都行，只要是同一标准对比即可。

af_x_if 发表于 2025-10-18 15:43

395更类似DGX Spark

https://www.youtube.com/watch?v=Pww8rIzr1pg

成绩也基本上就是256bit 8533对256bit 9500的差距

Miaow1874 发表于 2025-10-18 16:54

5090显存是1.7T带宽，395是200G带宽，你说呢

寒蝉鸣泣 发表于 2025-10-18 17:09

用脚指头想也知道5090吊打核显

monei 发表于 2025-10-18 17:29

af_x_if 发表于 2025-10-18 15:43
395更类似DGX Spark

https://www.youtube.com/watch?v=Pww8rIzr1pg

DGX Spark 比 395 AI算力高, 是吧? 价格要三万多. 我以为spark AI算力一定比rtx50系高呢.
不知道spark的操作系统是什么, 只知道cpu是arm架构的?

jcd_chh 发表于 2025-10-18 18:21

395优势就一个：大显存；其他的都不行，无论是带宽还是算力
N消费卡全都是被显存容量拖累的，否则哪儿还有核显的事儿

sun3797 发表于 2025-10-18 18:53

395AI是玩具，而rtx50可以入门用用

平安是福 发表于 2025-10-18 20:03

只能相当于4060差不多，还不支持cuda

atiufo 发表于 2025-10-18 20:44

你先要知道算力和显存容量是两个独立的指标[睡觉]

powerduke 发表于 2025-10-18 21:15

3.x tks，这是跟自己有多过不去啊

大头吃小头 发表于 2025-10-18 21:32

395只是能跑成本低
5090 32g有一部分模型是跑不了的
395最多能分配96g（128g的版本没出）
也就是规模大了5090直接扑，395能哼哧哼哧老牛拉磨。
但凡5090没扑的项目都是吊打395的

页: [1]

Chiphell - 分享与交流用户体验's Archiver

AMD AI MAX+ 395AI的核显AI算力比rtx50系列高吗?