monei 发表于 2025-10-18 14:41

AMD AI MAX+ 395AI的核显AI算力比rtx50系列高吗?

AMD AI MAX+ 395AI的核显可以使用96g内存作为显存, 那么这个核显的AI 算力比rtx50系列的显卡高很多,是吗?
刚接触到AI 大模型, 不太了解这一块, 所以问问大家.

真不易 发表于 2025-10-18 14:55

我也好奇,所以帮你问了下豆包:
在运行 DeepSeek 70B 模型时,RTX 5090 和 AMD AI MAX+ 395 各有优势。
从生成速度来看,RTX 5090 表现更优。实测数据显示,RTX 5090 在 DeepSeek R1-70B 模型上的生成速度达 45 tokens/s。而 AMD AI MAX+ 395 运行 DeepSeek R1 llama 70B 的生成速度为 3.55 tok/sec,运行 DeepSeek R1 qwen 32b 的速度为 8.91 tok/sec。不过,AMD AI MAX+ 395 在运行内存密集型的 AI 任务时,拥有高达 128GB 的统一内存,可将其中高达 96GB 分配为 VRAM。而 RTX 5090 的显存只有 32GB,在一些对显存容量要求极高的场景下可能会受到限制。

真不易 发表于 2025-10-18 14:56

这样看来,5090的32GB显存的算力,要远远大于395AI的算力。

自挂东南枝 发表于 2025-10-18 15:02

并不是,395的ai算力和显存带宽都不如5090,但显存容量大,在你的模型+上下文大于32G(或许更大一些)的时候,综合带宽就比5090大了(因为5090只有32G显存,大于32G的部分受限于pcie带宽了),这种情况下5090会受限于带宽导致ai性能骤减。
不过还有一点,其实395在跑这么大模型的时候速度也很慢,几乎不可用,395比较适合跑moe模型。(需要大显存,但算力需求小)

tim6252 发表于 2025-10-18 15:17

小水管超高流速VS大水管小流速

kanshuderen 发表于 2025-10-18 15:29

除非爆显存。。。不然完全不是一个量级的。。。。。

uprit 发表于 2025-10-18 15:41

你问算力啊?什么水管不水管的,那不叫算力。算力就是FLOPS,至于是FP32的还是FP16的甚至FP4的都行,只要是同一标准对比即可。

af_x_if 发表于 2025-10-18 15:43

395更类似DGX Spark

https://www.youtube.com/watch?v=Pww8rIzr1pg

成绩也基本上就是256bit 8533对256bit 9500的差距

Miaow1874 发表于 2025-10-18 16:54

5090显存是1.7T带宽,395是200G带宽,你说呢

寒蝉鸣泣 发表于 2025-10-18 17:09

用脚指头想也知道5090吊打核显

monei 发表于 2025-10-18 17:29

af_x_if 发表于 2025-10-18 15:43
395更类似DGX Spark

https://www.youtube.com/watch?v=Pww8rIzr1pg


DGX Spark 比 395 AI算力高, 是吧? 价格要三万多. 我以为spark AI算力一定比rtx50系高呢.
不知道spark的操作系统是什么, 只知道cpu是arm架构的?

jcd_chh 发表于 2025-10-18 18:21

395优势就一个:大显存;其他的都不行,无论是带宽还是算力
N消费卡全都是被显存容量拖累的,否则哪儿还有核显的事儿

sun3797 发表于 2025-10-18 18:53

395AI是玩具,而rtx50可以入门用用

平安是福 发表于 2025-10-18 20:03

只能相当于4060差不多,还不支持cuda

atiufo 发表于 2025-10-18 20:44

你先要知道算力和显存容量是两个独立的指标[睡觉]

powerduke 发表于 2025-10-18 21:15

3.x tks,这是跟自己有多过不去啊

大头吃小头 发表于 2025-10-18 21:32

395只是能跑 成本低
5090 32g有一部分模型是跑不了的
395最多能分配96g(128g的版本没出)
也就是规模大了5090直接扑,395能哼哧哼哧老牛拉磨。
但凡5090没扑的项目 都是吊打395的
页: [1]
查看完整版本: AMD AI MAX+ 395AI的核显AI算力比rtx50系列高吗?