找回密码
 加入我们
搜索
      
查看: 10798|回复: 38

[CPU] AMD兴奋了

[复制链接]
发表于 2025-1-30 23:03 | 显示全部楼层 |阅读模式
AMD非常兴奋的发布了旗下RX7900XTX消费级显卡在部署DeepSeek蒸馏小模型上和英伟达同级别显卡的速度差异
9f519e8bgy1hy2tdpngfsj20zk0ywgp0.jpg
发表于 2025-1-30 23:19 | 显示全部楼层
挺好 A卡也买不到了
发表于 2025-1-30 23:21 | 显示全部楼层
铲子多了
发表于 2025-1-31 00:27 | 显示全部楼层
看了一下价格,还是等9070XT出来再说
发表于 2025-1-31 00:27 | 显示全部楼层
完了,amd的卡要涨价了........
发表于 2025-1-31 00:28 | 显示全部楼层
gjbsas 发表于 2025-1-31 00:27
完了,amd的卡要涨价了........

应该是这样的
发表于 2025-1-31 00:39 来自手机 | 显示全部楼层
Nvidia cuda护城河没有后,4090 连7900xtx也打不过么
发表于 2025-1-31 00:41 来自手机 | 显示全部楼层
gjbsas 发表于 2025-1-31 00:27
完了,amd的卡要涨价了........

咸鱼已经涨了 前几天还有5300非钙版的7900xtx

今天已经钙版最低5600了

发表于 2025-1-31 00:42 来自手机 | 显示全部楼层
cloudybeyond 发表于 2025-1-31 00:39
Nvidia cuda护城河没有后,4090 连7900xtx也打不过么

都amd官方宣传了,自己想想amd对于自家apu是怎么吹嘘的
发表于 2025-1-31 00:43 | 显示全部楼层
可以兴奋的增加msrp了
发表于 2025-1-31 00:44 | 显示全部楼层
挺好 A卡也买不到了
发表于 2025-1-31 01:40 | 显示全部楼层
A家是为了涨价,不是为了给N家价格打下来。。
发表于 2025-1-31 11:41 | 显示全部楼层
希望国产显卡也能崛起!!
发表于 2025-1-31 11:43 | 显示全部楼层
他这个是蒸馏后小模型吧  看其他论坛说的 就是蹭个热度
发表于 2025-1-31 11:48 | 显示全部楼层
额,amd要涨价了。
发表于 2025-1-31 11:58 | 显示全部楼层
momo77989724 发表于 2025-1-31 11:43
他这个是蒸馏后小模型吧  看其他论坛说的 就是蹭个热度

个人没事也没有部署671B的大模型吧,我16G部署了个14B的也不错占用了11G显存。671B的模型量化压缩后都需要上几百G的显存。
发表于 2025-1-31 12:00 | 显示全部楼层
mkkkno1 发表于 2025-1-31 11:58
个人没事也没有部署671B的大模型吧,我16G部署了个14B的也不错占用了11G显存。671B的模型量化压缩后都需 ...

这倒是
发表于 2025-1-31 13:09 | 显示全部楼层
4080 跑DS 更强????
发表于 2025-1-31 13:47 来自手机 | 显示全部楼层
cloudybeyond 发表于 2025-1-31 00:39
Nvidia cuda护城河没有后,4090 连7900xtx也打不过么

Cuda护城河主要指的是部署难度,理论算力amd一直都不虚的。

问题是,护城河没有了吗?ds那个类汇编的写法对硬件的绑定不是更深吗?
发表于 2025-1-31 13:59 来自手机 | 显示全部楼层
蒸馏酒更好,更烈
发表于 2025-1-31 14:00 | 显示全部楼层
这是为9070铺路
发表于 2025-1-31 15:12 | 显示全部楼层
gartour 发表于 2025-1-31 13:47
Cuda护城河主要指的是部署难度,理论算力amd一直都不虚的。

问题是,护城河没有了吗?ds那个类汇编的写 ...

汇编优化很难很麻烦,大部分中小企业都弄不来。
理论上跳过CUDA去汇编优化的,
技术水平换别的卡一样可以优化。
发表于 2025-1-31 15:19 | 显示全部楼层
想着搞一套部署 7900xtx 部署deepseek了
发表于 2025-1-31 16:53 来自手机 | 显示全部楼层
xks07 发表于 2025-1-31 15:12
汇编优化很难很麻烦,大部分中小企业都弄不来。
理论上跳过CUDA去汇编优化的,
技术水平换别的卡一样可以 ...

是的。但不管程序员的水平高低,汇编的迁移成本始终是高于是cuda的。

所以ds并不是打破了cuda的护城河,只是说他们程序员的水平够高,可以无视这个护城河。他们采用编程方法比突破cuda反而要更加难。
发表于 2025-1-31 18:06 | 显示全部楼层
7900xtx有24g显存,能本地跑 32b的deepseek-r1了吧,我看ollama已经支持7900xtx了
发表于 2025-1-31 19:26 来自手机 | 显示全部楼层
gartour 发表于 2025-1-31 16:53
是的。但不管程序员的水平高低,汇编的迁移成本始终是高于是cuda的。

所以ds并不是打破了cuda的护城河, ...

不,对于头部公司来说,比如苹果meta他们有的是钱。缺的是思路和路线。ds发酵后到现在苹果和meta股价是大涨的。汇编优化再难有造个iOS系统难么?模型对算力要求的大幅降低是端侧ai的大利好。云端大模型的盈利模式其实是有问题的。有点像互联网刚开始的电子邮箱。
发表于 2025-1-31 19:42 | 显示全部楼层
乐呵乐呵得了,一个大模型改变不了什么
发表于 2025-1-31 20:59 来自手机 | 显示全部楼层
xks07 发表于 2025-1-31 19:26
不,对于头部公司来说,比如苹果meta他们有的是钱。缺的是思路和路线。ds发酵后到现在苹果和meta股价是大 ...

很多公司都被高昂的采购成本逼的要自造芯片了,很难想象这些公司此前没有在汇编这个方向上做过尝试。

当然这只是一种推测,总之让子弹飞一飞
发表于 2025-1-31 21:35 | 显示全部楼层
gartour 发表于 2025-1-31 20:59
很多公司都被高昂的采购成本逼的要自造芯片了,很难想象这些公司此前没有在汇编这个方向上做过尝试。

当 ...

主要是被openai带进坑了
因为它的大模型最先进。行业领头者。
后面都是追赶它的思路。
加上搞大模型的都是些互联网巨头,预算和卡多不少。
没想过拼命去优化算力。
幻方的1万多张A100根本不算多。
那些说5万张H100的纯粹搞笑的。H100发布两个月还没大规模上市就被禁售了。
发表于 2025-1-31 23:04 | 显示全部楼层
挖矿的时候带A卡玩。也涨不到哪去
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-4-26 11:29 , Processed in 0.036986 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表