|
本帖最后由 welsmann 于 2025-4-12 18:19 编辑 说实话,感觉经典CV领域基本上已经是边际效应拉满了,正如楼上所述,一个词评价, williamqh 发表于 2025-4-10 11:37 如测 -_-|| Ampere以后,重心开始倾向低精度。 没有FP4的测试,就算了,你可以跟我说pytorch还没跟上 那, 为什么没有FP8的测试? 还有,之前坛子里类似的贴子中, 有人之前跟我说训练和推理对卡的负载相似,但为什么没有训练的测试呢? 应该能体现普遍性的呀 以前针对4090的优化的FP8脚本也拿出来看看喽,反正FP8都兼容的。 跑个FP8的FLUX1. Lora测试一下呗~4090都能吃满的 |
williamqh 发表于 2025-4-10 11:37 因为实现距离硬件性能上限太远, 就算有锁也撞不到锁 上面那些测试项目本身规模太小, 就算充分优化, 训练时tensorcore使用率都一般不会到10%, 而手搓pytorch代码更是"就算充分优化"这个假设都大概率不存在了 你会认为测红警的帧率能代表2025年旗舰卡的性能吗 |
| 5090D国行有质保,也不比5090差啥,还是值得入手的。 |
|
看来可以年底冲5090d了。 |
z010q3w 发表于 2025-4-10 11:43 理论上不能 芯片代码不同 不过刷5090的BIOS没有意义啊,一样锁600W |
| 纯游戏玩家表示围观 |
| 5090D可以刷5090的bios吗? |
awpak78 发表于 2025-4-10 09:46 为什么呀?他用的模型不都是一些已知模型么? |
|
手搓pytorch代码测显卡AI性能 含金量比用原神测旗舰显卡还高,近似于用Minecraft+TNT测评新旗舰显卡 有种大二上机课刚学会 pip install torch 的美 |
StevenG 发表于 2025-4-9 19:05 多卡不受影响的 不论90还是90D 已经有实测 |
| 大家关注的,不一直是多卡性能有没有阉割嘛,单卡的差距哪怕按照老黄的ppt来,炼丹佬也不在意的。。 |
| 我也跑了一些模型是没区别,不排除后期来个驱动软锁 |
Archiver|手机版|小黑屋|Chiphell
( 沪ICP备12027953号-5 )
310112100042806
GMT+8, 2025-10-31 04:30 , Processed in 0.011002 second(s), 9 queries , Gzip On, Redis On.
Powered by Discuz! X3.5 Licensed
© 2007-2024 Chiphell.com All rights reserved.