5090的ai算力扒完皮仅剩419TFLOPS - 第2页 - 电脑讨论(新) - Chiphell - 分享与交流用户体验

buxp 发表于 2025-1-19 06:12

q3again0605 发表于 2025-1-18 19:32
这点我一直不明白什么意思，nvlink 4090就没有，p2p的话4090可以破，5090有人看过了吗，有没有large bar ...

很多程序插上就能用的。。不需要NVLINK

shenqingyi 发表于 2025-1-19 08:52

fgfdhgg 发表于 2025-1-18 18:38
现在的造谣路线是
因为老黄做过LHR软锁算力，后续给解锁了
而且5090D看起来大概率也是软锁

解锁你可想太多了。

q3again0605 发表于 2025-1-19 10:48

buxp 发表于 2025-1-19 06:12
很多程序插上就能用的。。不需要NVLINK

不管是大参数模型的推理还是训练，卡间通信走nvlink至少p2p还是很有意义的。目前专业卡至少还有p2p这样在并行推理上还是很有优势的

dream3446 发表于 2025-1-19 12:12

PolyMorph 发表于 2025-1-18 18:16
rt core x 频率

频率不是只差了0.1G吗？每个算力怎么会差30%+？

用户发表于 2025-1-19 13:08

算力不是看fp16 with fp32 accumulate那一行吗？4090被砍半才160，5090可能是满速。

PolyMorph 发表于 2025-1-19 16:15

本帖最后由 PolyMorph 于 2025-1-20 03:28 编辑

用户发表于 2025-1-19 13:08
算力不是看fp16 with fp32 accumulate那一行吗？4090被砍半才160，5090可能是满速。

quadro tesla计算卡才会满速，5090要是满血，tf32fp32 on tensor，这些卡不用卖了

https://pan.imgbed.link/file/219721

https://pan.imgbed.link/file/219721

YsHaNg 发表于 2025-1-19 22:40

赫敏发表于 2025-1-18 08:18
现在fp4能算什么

self host跑推理模型都q4量化其实连int4都用不上拿fp32速度也完全够还是得单卡塞大显存参数量堆上去

jaycty 发表于 2025-1-22 13:48

5090 D真的是纯纯的智商税了 AI性能还不如4090吗

8xwob3ko 发表于 2025-1-22 14:24

jaycty 发表于 2025-1-22 13:48
5090 D真的是纯纯的智商税了 AI性能还不如4090吗

卡着禁售线不就是这样吗，官网虽然玩文字游戏但是参数和标准都写的很明白，实际 5090D 就是 4090D 一个水平的算力

楼主的马甲 发表于 2025-1-22 16:03

PolyMorph 发表于 2025-1-19 16:15
quadro tesla计算卡才会满速，5090要是满血，tf32fp32 on tensor，这些卡不用卖了

记得那些卡制程比RTX卡低吧？反而频率高？

页: 1 [2]

Chiphell - 分享与交流用户体验's Archiver