找回密码
 加入我们
搜索
      
查看: 4417|回复: 74

[显卡] 感觉低成本架设私人AI服务器的时机快成熟了,AMD MI50/MI100大船

[复制链接]
发表于 2025-4-16 09:32 | 显示全部楼层 |阅读模式
本帖最后由 boyinfly 于 2025-4-16 10:06 编辑

看到陆续有大船靠岸,大批AMD的计算卡进入国内,主要以MI50 16G和MI100 32G为主。
这卡黄鱼上MI50 16G目前600左右,MI100 32G900左右,无风扇,非常适合服务器插个4卡8卡跑AI。
这卡应该是第一批7nm的产品,对应民用版就是Radeon VII,功耗不算高。而且这卡还带一个mini-DP,刷个Radeon VII的bios就可以当显卡用,不刷bios也能用核显串流显示,类似于P106。二三十块钱DIY个涡轮扇挂屁股后面普通电脑或者外置显卡坞也能用,主要显存都是HBM的,非常适合跑AI玩。我都想弄两块跑个私人deepseek玩了。


查了一下,这卡当初3万多,现在50分之1的价格
我不卖卡,我也是网上看到的消息,别找我买卡,买卡直接去小黄鱼!!!



AMD RADEON INSTINCT MI50 16GB PCIe.
PN -102D 1631 412 702883.
R-R-ATI-102-16302.

QTY :  41,200 units  ( tested working pulled )

AMD MI50.jpg
发表于 2025-4-16 09:34 | 显示全部楼层
MI100?是MI50 32G吧。。
发表于 2025-4-16 09:36 | 显示全部楼层
这个性能4张32G能跑多大的模型
 楼主| 发表于 2025-4-16 09:37 | 显示全部楼层
klxq15 发表于 2025-4-16 09:34
MI100?是MI50 32G吧。。

MI50 16G/32G
MI100 32G
发表于 2025-4-16 09:38 | 显示全部楼层
boyinfly 发表于 2025-4-16 09:37
MI50 16G/32G
MI100 32G

MI100 32G卖多少钱。。为啥华强北还没出MI系列的显卡桥
发表于 2025-4-16 09:39 来自手机 | 显示全部楼层
boyinfly 发表于 2025-4-16 09:37
MI50 16G/32G
MI100 32G

黄鱼上没看到mi100 32g呀。。都是mi50 32g 950上下
 楼主| 发表于 2025-4-16 09:39 | 显示全部楼层
本帖最后由 boyinfly 于 2025-4-16 09:57 编辑
popgame 发表于 2025-4-16 09:36
这个性能4张32G能跑多大的模型


1张,跑70b q4,大概7-8tok/s


这是单卡性能,4卡linux下性能X4,22左右
 楼主| 发表于 2025-4-16 09:42 | 显示全部楼层
klxq15 发表于 2025-4-16 09:38
MI100 32G卖多少钱。。为啥华强北还没出MI系列的显卡桥

MI100估计船快到了吧,MI100已经是7nm的CDNA核心了
现在主要是MI50 16G/32G vega20核心


https://www.amd.com/zh-cn/produc ... s/accelerators.html


amd MI.jpg
发表于 2025-4-16 09:48 | 显示全部楼层
boyinfly 发表于 2025-4-16 09:39
4张,跑70b q4,大概7-8tok/s

这速度也就玩个三分钟热情了。开个深度思考还得跌到 1以下
发表于 2025-4-16 09:49 来自手机 | 显示全部楼层
boyinfly 发表于 2025-4-16 09:42
MI100估计船快到了吧,MI100已经是7nm的CDNA核心了
现在主要是MI50 16G/32G vega20核心


那100还有折腾的价值,vega估计下个版本的rocm就彻底不支持了吧
 楼主| 发表于 2025-4-16 09:50 | 显示全部楼层
popgame 发表于 2025-4-16 09:36
这个性能4张32G能跑多大的模型

模型版本        参数量(B)        显存需求(GB)
DeepSeek 1.5B        15亿        60
DeepSeek 7B        70亿        240(FP16),120(AMP)
DeepSeek 32B        320亿        512(FP16),256(AMP)
DeepSeek 70B        700亿        1200(FP16),600(AMP)
DeepSeek 671B        6710亿        10736(FP16),5368(AMP)
发表于 2025-4-16 09:53 | 显示全部楼层
性能太低了,不然也不会成垃圾
 楼主| 发表于 2025-4-16 09:53 | 显示全部楼层
gartour 发表于 2025-4-16 09:48
这速度也就玩个三分钟热情了。开个深度思考还得跌到 1以下

主要是这卡便宜啊,低成本搭建私人ai服务器成为可能
 楼主| 发表于 2025-4-16 09:55 | 显示全部楼层
StevenG 发表于 2025-4-16 09:49
那100还有折腾的价值,vega估计下个版本的rocm就彻底不支持了吧

至少目前linux下这卡效能还是可以的,毕竟也是7nm的
600/900块就能买16G/32 HBM显存的卡,还不便宜?
刷个bios还能当游戏卡用一下,性能差不多3060水平了

评分

参与人数 1邪恶指数 +1 收起 理由
Mufasa + 1 支持一下

查看全部评分

 楼主| 发表于 2025-4-16 09:55 | 显示全部楼层
mkkkno1 发表于 2025-4-16 09:53
性能太低了,不然也不会成垃圾

18年的卡,这性能可以了。
 楼主| 发表于 2025-4-16 09:58 | 显示全部楼层
mkkkno1 发表于 2025-4-16 09:53
性能太低了,不然也不会成垃圾

1张,跑70b q4,大概7-8tok/s


这是单卡性能,4卡linux下性能X4,22左右
发表于 2025-4-16 09:59 | 显示全部楼层
性能太差,只能拿来跑跑LLM;
还不如买V100 16G 组组多卡
发表于 2025-4-16 09:59 | 显示全部楼层
显卡是用来打游戏的
 楼主| 发表于 2025-4-16 10:03 | 显示全部楼层
KimmyGLM 发表于 2025-4-16 09:59
性能太差,只能拿来跑跑LLM;
还不如买V100 16G 组组多卡

MI50算力和V100是一个级别的

a100.jpg
发表于 2025-4-16 10:04 来自手机 | 显示全部楼层
这玩意不是镭七吗
 楼主| 发表于 2025-4-16 10:05 | 显示全部楼层
archxm 发表于 2025-4-16 09:59
显卡是用来打游戏的

这卡不太适合打游戏,要弄个涡轮扇,长度太长了,差不多36cm了,很多机箱放不下,涡轮扇噪音也是一个问题
 楼主| 发表于 2025-4-16 10:05 | 显示全部楼层
用户 发表于 2025-4-16 10:04
这玩意不是镭七吗

对,换皮的计算卡
发表于 2025-4-16 10:08 | 显示全部楼层
boyinfly 发表于 2025-4-16 09:39
1张,跑70b q4,大概7-8tok/s

ollama只支持PP,别™做梦性能x4了,多少张卡都是一样的速度

AMD浪费沙子拿着7nm的工艺干出来16nm Tesla P100相当的性能,还5年就完全停止软件支持,别吹电子垃圾了。

【半块RTX4090 玩转70B大语言模型】 https://www.bilibili.com/video/BV1DH4y1c7gK/
👆
P100多卡再垃圾起码还有CUDA更新,跑得起来卡间通信
发表于 2025-4-16 10:08 | 显示全部楼层
boyinfly 发表于 2025-4-16 10:03
MI50算力和V100是一个级别的


哪门子的一个级别...v100的tensorcore虽然烂但又不是用不上
    还有这张图把v100的tensorcore fp16算力标到tf32那栏里了
 楼主| 发表于 2025-4-16 10:14 来自手机 | 显示全部楼层
awpak78 发表于 2025-4-16 10:08
ollama只支持PP,别™做梦性能x4了,多少张卡都是一样的速度

AMD浪费沙子拿着7nm的工艺干出来16nm Tesla ...

我有必要吹这电子垃圾么,我又不是卖卡的,你要只会用ollama这卡不适合你
 楼主| 发表于 2025-4-16 10:15 来自手机 | 显示全部楼层
zhuifeng88 发表于 2025-4-16 10:08
哪门子的一个级别...v100的tensorcore虽然烂但又不是用不上
    还有这张图把v100的tensorcore fp16算力 ...

v100家用普通电脑不如这卡容易玩,好歹这卡还能当个游戏卡用
发表于 2025-4-16 10:17 | 显示全部楼层
boyinfly 发表于 2025-4-16 10:15
v100家用普通电脑不如这卡容易玩,好歹这卡还能当个游戏卡用

V100 可以当游戏卡用啊,TCC改成WDDM 模式就行。
发表于 2025-4-16 10:18 | 显示全部楼层
boyinfly 发表于 2025-4-16 09:39
1张,跑70b q4,大概7-8tok/s

1张,跑70b q4,大概7-8tok/s

爆显存了吧,有没 33b q4 的测试数据呀?
 楼主| 发表于 2025-4-16 10:21 来自手机 | 显示全部楼层
Miner 发表于 2025-4-16 10:18
1张,跑70b q4,大概7-8tok/s

爆显存了吧,有没 33b q4 的测试数据呀?

网上搜一下吧,我还没买这卡,正考虑是否买两片玩玩,看情况这卡价格可能还要跌,感觉四五百块钱是正常大船价格
发表于 2025-4-16 10:23 | 显示全部楼层
我玩过9070xt跑推理,只能讲不要对农企有任何期待,这远古vega还是啥架构插服务器上都是浪费服务器槽位。
9070xt特性全开,软件适配全开,然后单颗核心显存容量翻倍然后俩个做互联怼起来,才能有看头
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-4-25 13:47 , Processed in 0.015066 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表