buxp 发表于 2025-1-19 06:12

q3again0605 发表于 2025-1-18 19:32
这点我一直不明白什么意思,nvlink 4090就没有,p2p的话4090可以破,5090有人看过了吗,有没有large bar ...

很多程序插上就能用的。。不需要NVLINK

shenqingyi 发表于 2025-1-19 08:52

fgfdhgg 发表于 2025-1-18 18:38
现在的造谣路线是
因为老黄做过LHR软锁算力,后续给解锁了
而且5090D看起来大概率也是软锁


解锁你可想太多了。

q3again0605 发表于 2025-1-19 10:48

buxp 发表于 2025-1-19 06:12
很多程序插上就能用的。。不需要NVLINK

不管是大参数模型的推理还是训练,卡间通信走nvlink至少p2p还是很有意义的。目前专业卡至少还有p2p这样在并行推理上还是很有优势的

dream3446 发表于 2025-1-19 12:12

PolyMorph 发表于 2025-1-18 18:16
rt core x 频率

频率不是只差了0.1G吗?每个算力怎么会差30%+?

用户 发表于 2025-1-19 13:08

算力不是看fp16 with fp32 accumulate那一行吗?4090被砍半才160,5090可能是满速。

PolyMorph 发表于 2025-1-19 16:15

本帖最后由 PolyMorph 于 2025-1-20 03:28 编辑

用户 发表于 2025-1-19 13:08
算力不是看fp16 with fp32 accumulate那一行吗?4090被砍半才160,5090可能是满速。

quadro tesla计算卡才会满速,5090要是满血,tf32fp32 on tensor,这些卡不用卖了

https://pan.imgbed.link/file/219721

https://pan.imgbed.link/file/219721

YsHaNg 发表于 2025-1-19 22:40

赫敏 发表于 2025-1-18 08:18
现在fp4能算什么

self host跑推理模型都q4量化 其实连int4都用不上拿fp32速度也完全够 还是得单卡塞大显存参数量堆上去

jaycty 发表于 2025-1-22 13:48

5090 D真的是纯纯的智商税了 AI性能还不如4090吗

8xwob3ko 发表于 2025-1-22 14:24

jaycty 发表于 2025-1-22 13:48
5090 D真的是纯纯的智商税了 AI性能还不如4090吗

卡着禁售线不就是这样吗,官网虽然玩文字游戏但是参数和标准都写的很明白,实际 5090D 就是 4090D 一个水平的算力

楼主的马甲 发表于 2025-1-22 16:03

PolyMorph 发表于 2025-1-19 16:15
quadro tesla计算卡才会满速,5090要是满血,tf32fp32 on tensor,这些卡不用卖了




记得那些卡制程比RTX卡低吧?反而频率高?
页: 1 [2]
查看完整版本: 5090的ai算力扒完皮仅剩419TFLOPS