找回密码
 加入我们
搜索
      
楼主: deader

[CPU] AMD兴奋了

[复制链接]
发表于 2025-2-1 01:09 | 显示全部楼层
gartour 发表于 2025-1-31 16:53
是的。但不管程序员的水平高低,汇编的迁移成本始终是高于是cuda的。

所以ds并不是打破了cuda的护城河, ...

我感觉最关键的是, 跳过cuda性能可以翻几倍, 说明cuda包袱挺厚啊, 比虚拟机的性能损耗还厉害

cuda的设计或者实现是不是不太行? 该有一个新的东西取代它了
发表于 2025-2-1 01:15 | 显示全部楼层
xks07 发表于 2025-1-31 21:35
主要是被openai带进坑了
因为它的大模型最先进。行业领头者。
后面都是追赶它的思路。

现在硅谷的程序员可能真的太滋润了, 没人愿意接触汇编这类底层的东西了
发表于 2025-2-1 01:58 来自手机 | 显示全部楼层
netjunegg 发表于 2025-2-1 01:09
我感觉最关键的是, 跳过cuda性能可以翻几倍, 说明cuda包袱挺厚啊, 比虚拟机的性能损耗还厉害

cuda的设计 ...

某些计算密集场景汇编带来几倍提升有可能的,比如视频编码器,x264, x265都是深度汇编优化的。。。顺便,对硅谷程序员不碰汇编这类低级语言的说法持保留态度。
发表于 2025-2-1 02:03 来自手机 | 显示全部楼层
xks07 发表于 2025-1-31 21:35
主要是被openai带进坑了
因为它的大模型最先进。行业领头者。
后面都是追赶它的思路。

改进效率和堆算力并不互斥。

算力饥渴本身就会对效率改进有很强驱动力。

另外,禁不住的,只是提高了进货成本而已。4090你都能买到,有钞能力的那些烧钱公司手段只会更多。
发表于 2025-2-1 02:11 来自手机 | 显示全部楼层
xks07 发表于 2025-1-31 06:26
不,对于头部公司来说,比如苹果meta他们有的是钱。缺的是思路和路线。ds发酵后到现在苹果和meta股价是大 ...

挺好的啊,各种废物aipc终于盼来了希望
发表于 2025-2-1 08:47 | 显示全部楼层
太厉害了 快去买吧
发表于 2025-2-1 11:32 | 显示全部楼层
这里是拿卡做推理用的,不是用于ai训练,急啥。推理就算完整的ds模型大概一个小型服务器加4到8张卡就够了,和训练不是一个数量级。
发表于 2025-2-1 12:07 来自手机 | 显示全部楼层
netjunegg 发表于 2025-2-1 01:09
我感觉最关键的是, 跳过cuda性能可以翻几倍, 说明cuda包袱挺厚啊, 比虚拟机的性能损耗还厉害

cuda的设计 ...

cuda必然损失很大的,我是一直这么觉得的,很多搞ai不搞这些底层的也不奇怪,我接触的互联网搞ai算法的大多瞧不起工程级别的事情,眼高手底,幻方因为搞量化,比较注重工程实现和硬件效率,不是互联网搞出来也不意外。
发表于 2025-2-2 01:08 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-4-26 15:04 , Processed in 0.010013 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表