找回密码
 加入我们
搜索
      
查看: 2764|回复: 12

[显卡] 转:5090与5090D在深度学习模型上的基准性能测试

[复制链接]
发表于 2025-4-9 18:29 | 显示全部楼层 |阅读模式
【5090和5090D在深度学习模型上的基准性能测试】https://www.bilibili.com/video/B ... 8f7928239b03a00abe8
微信截图_20250409181829.png 微信截图_20250409181845.png
补充下:5090使用的是96G DDR5 6400内存

先说结论
微信截图_20250409181638.png

汇总对比图
微信截图_20250409182433.png

微信截图_20250409182305.png 微信截图_20250409182326.png 微信截图_20250409182344.png 微信截图_20250409182359.png 微信截图_20250409182415.png 微信截图_20250409182211.png 微信截图_20250409182228.png 微信截图_20250409182248.png

发表于 2025-4-9 19:04 | 显示全部楼层
我也跑了一些模型是没区别,不排除后期来个驱动软锁
发表于 2025-4-9 19:05 来自手机 | 显示全部楼层
大家关注的,不一直是多卡性能有没有阉割嘛,单卡的差距哪怕按照老黄的ppt来,炼丹佬也不在意的。。
 楼主| 发表于 2025-4-9 19:32 | 显示全部楼层
StevenG 发表于 2025-4-9 19:05
大家关注的,不一直是多卡性能有没有阉割嘛,单卡的差距哪怕按照老黄的ppt来,炼丹佬也不在意的。。 ...

多卡不受影响的   不论90还是90D 已经有实测
发表于 2025-4-10 09:46 | 显示全部楼层
手搓pytorch代码测显卡AI性能

含金量比用原神测旗舰显卡还高,近似于用Minecraft+TNT测评新旗舰显卡

有种大二上机课刚学会 pip install torch 的美
发表于 2025-4-10 11:37 | 显示全部楼层
awpak78 发表于 2025-4-10 09:46
手搓pytorch代码测显卡AI性能

含金量比用原神测旗舰显卡还高,近似于用Minecraft+TNT测评新旗舰显卡

为什么呀?他用的模型不都是一些已知模型么?
发表于 2025-4-10 11:43 | 显示全部楼层
5090D可以刷5090的bios吗?
发表于 2025-4-10 11:52 | 显示全部楼层
纯游戏玩家表示围观
 楼主| 发表于 2025-4-10 12:56 | 显示全部楼层
z010q3w 发表于 2025-4-10 11:43
5090D可以刷5090的bios吗?

理论上不能   芯片代码不同
不过刷5090的BIOS没有意义啊,一样锁600W
发表于 2025-4-11 21:42 | 显示全部楼层
看来可以年底冲5090d了。
发表于 2025-4-12 17:03 | 显示全部楼层
5090D国行有质保,也不比5090差啥,还是值得入手的。
发表于 2025-4-12 17:34 | 显示全部楼层
williamqh 发表于 2025-4-10 11:37
为什么呀?他用的模型不都是一些已知模型么?

因为实现距离硬件性能上限太远, 就算有锁也撞不到锁
上面那些测试项目本身规模太小, 就算充分优化, 训练时tensorcore使用率都一般不会到10%, 而手搓pytorch代码更是"就算充分优化"这个假设都大概率不存在了

你会认为测红警的帧率能代表2025年旗舰卡的性能吗
发表于 2025-4-12 18:12 | 显示全部楼层
本帖最后由 welsmann 于 2025-4-12 18:19 编辑

说实话,感觉经典CV领域基本上已经是边际效应拉满了,正如楼上所述,一个词评价,

williamqh 发表于 2025-4-10 11:37
为什么呀?他用的模型不都是一些已知模型么?

因为实现距离硬件性能上限太远, 就算有锁也撞不到锁
上面那些测试项目本身规模太小, 就算充分优化, 训练时tensorcore使用率都一般不会到10%, 而手搓pytorch代码更是"就算充分优化"这个假设都大概率不存在了

你会认为测红警的帧率能代表2025年旗舰卡的性能吗

如测  -_-||


Ampere以后,重心开始倾向低精度。
没有FP4的测试,就算了,你可以跟我说pytorch还没跟上

那,
为什么没有FP8的测试?

还有,之前坛子里类似的贴子中,
有人之前跟我说训练和推理对卡的负载相似,但为什么没有训练的测试呢?

应该能体现普遍性的呀

以前针对4090的优化的FP8脚本也拿出来看看喽,反正FP8都兼容的。
跑个FP8的FLUX1. Lora测试一下呗~4090都能吃满的
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-4-28 19:33 , Processed in 0.013101 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表