找回密码
 加入我们
搜索
      
楼主: hred9D

[显卡] 5090D是芯片核心锁死,有图为证

[复制链接]
发表于 2025-3-9 20:48 | 显示全部楼层
我特意看了下发帖日期
发表于 2025-3-9 21:58 | 显示全部楼层
lz火星了?
发表于 2025-3-10 11:59 | 显示全部楼层
gLaiVe 发表于 2025-3-9 14:13
那4090可以多卡互联么?是所有的5090也都不能多卡互联么?

40可以的。。
发表于 2025-3-10 11:59 | 显示全部楼层
本帖最后由 BADASSBOT 于 2025-3-10 12:02 编辑
robles 发表于 2025-3-9 19:08
你这是哪里天顶星的新闻,40代就封杀了nvlink好不好。


我说的互联又不是NVLINK。。。你火星了把

40系起码一个系统内能多卡,50系直接都不行了
发表于 2025-3-10 12:07 | 显示全部楼层
hjmfun 发表于 2025-3-9 14:57
迷惑,没有任何技术分析,全是烂大街的信息。如果芯片刻印可以算证据,华强北已经掌握让3090 变‘4090’的 ...

这个技术,国家项目里面早就用上了   
发表于 2025-3-10 12:26 | 显示全部楼层
lh4357 发表于 2025-3-8 20:06
你这句话我更看不懂了。
“只知道是这样,却不知道为什么是这样。”
问题是,我连是不是这样(有没有锁) ...

是没有人测还是说目前测下来 90和90d算力一样?
发表于 2025-3-10 12:31 | 显示全部楼层
本帖最后由 lh4357 于 2025-3-10 12:34 编辑
小豆豆2 发表于 2025-3-10 12:26
是没有人测还是说目前测下来 90和90d算力一样?


是测不出来,目前我只发现fp32+fp16混合精度训练,会降速到一个epoch时间比4090还长。
但这个是算力锁还是软件BUG就不好说,因为fp32+bf16混合,速度又快了,而且纯fp32 fp16 bf16的速度都不会被影响。
发表于 2025-3-10 12:33 | 显示全部楼层
现代芯片设计技术里面有种器件叫做efuse,可以集成在硅片中,永久控制晶体管的行为;即使一摸一样的产片,一摸一样的批次,一摸一样的晶体管,只要通过JTAG之类的接口刷写一次,就可以改变芯片原有的规格和功能,甚至能废弃它。
发表于 2025-3-10 13:40 | 显示全部楼层
5090D本地部署deepseek r1 32b推理速度比4090快30%你怎么解释啊
微信图片_20250310133956.png 微信图片编辑_20250310134020.jpg
发表于 2025-3-10 15:12 | 显示全部楼层
BADASSBOT 发表于 2025-3-10 11:59
我说的互联又不是NVLINK。。。你火星了把

40系起码一个系统内能多卡,50系直接都不行了 ...

这个据说没有问题,跟4090一样。
发表于 2025-3-10 17:07 | 显示全部楼层
很多人不相信可以改到96G,以为最多48G,其实可以的,显存中运行程序,效率极高,这就是4090黄牛价格居高不下的原因,


论坛里终于有人证实了96g卡的存在?你这不赶紧单开一帖开箱测试一下吗?
发表于 2025-3-10 17:59 | 显示全部楼层
BADASSBOT 发表于 2025-3-10 11:59
我说的互联又不是NVLINK。。。你火星了把

40系起码一个系统内能多卡,50系直接都不行了 ...

你听抄测试流程都抄不明白纯瞎测一通的kol放屁...
Screenshot 2025-03-10 175913.png
Screenshot 2025-03-10 173714.png
 楼主| 发表于 2025-3-10 20:50 | 显示全部楼层
SkyGZO 发表于 2025-3-10 13:40
5090D本地部署deepseek r1 32b推理速度比4090快30%你怎么解释啊

本地部署或端侧AI,是使用已经训练好的“权重文件”(比如7B,32B,671B),GPU越强,读取效率就更高,这些是使用的场景。
这不是训练权重的场景,5090D不具有超过4090的训练推理能力,训练生成权重文件的效率不超过4090,是芯片级别的锁死。
发表于 2025-3-10 21:42 | 显示全部楼层
hred9D 发表于 2025-3-8 11:45
一张显卡,对公司没有意义。小型计算和示范,使用几张卡还是可以的,比如极客湾用4张4090,个人电脑上使用 ...

fp8训练 本身效率就挺高的
我宣布 两年以后今天一定是2027年
发表于 2025-3-10 21:46 | 显示全部楼层
fdgfdhfh 发表于 2025-3-9 01:47
你这标题没起对,应该叫:

今天,我突然发现5090和5090D的核心代号不一样

一直没开联网搜索的ai今天突然被人配置了搜索引擎api
发表于 2025-3-10 21:48 | 显示全部楼层
lh4357 发表于 2025-3-10 04:31
是测不出来,目前我只发现fp32+fp16混合精度训练,会降速到一个epoch时间比4090还长。
但这个是算力锁还 ...


架构变了呀 像gtx10系那代一样
发表于 2025-3-10 21:59 | 显示全部楼层
zhuifeng88 发表于 2025-3-10 17:59
你听抄测试流程都抄不明白纯瞎测一通的kol放屁...

tinygrad的p2p  mod不管用啊,大佬你这是怎么实现的
发表于 2025-3-10 21:59 | 显示全部楼层
lh4357 发表于 2025-3-8 20:06
你这句话我更看不懂了。
“只知道是这样,却不知道为什么是这样。”
问题是,我连是不是这样(有没有锁) ...

他说不出来了,只能车轱辘话
发表于 2025-3-10 23:09 | 显示全部楼层
翻来覆去一直在云……合着是穿越来的啊?
发表于 2025-3-11 04:22 | 显示全部楼层
老司机dd 发表于 2025-3-10 21:59
tinygrad的p2p  mod不管用啊,大佬你这是怎么实现的

不要p2p啊, 又不是没有就不能用
而且实际微调场景下有没有p2p性能差个零头而已
发表于 2025-3-11 08:33 | 显示全部楼层
其实不是穿越,最近90D开始放货了,黄牛搞来的90卖不出去了,肯定要想点不同出来,才能继续卖4w的高价
而且2w5的90d还能有保修,50出幺蛾子的事情又不少,外面的货拆开就少rop是没人管的
发表于 2025-3-11 10:17 | 显示全部楼层
zhuifeng88 发表于 2025-3-10 17:59
你听抄测试流程都抄不明白纯瞎测一通的kol放屁...

好消息,好消息、。。。我该更新了
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-4-26 11:36 , Processed in 0.012858 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表