这点我一直不明白什么意思,nvlink 4090就没有,p2p的话4090可以破,5090有人看过了吗,有没有large bar ...
很多程序插上就能用的。。不需要NVLINK fgfdhgg 发表于 2025-1-18 18:38
现在的造谣路线是
因为老黄做过LHR软锁算力,后续给解锁了
而且5090D看起来大概率也是软锁
解锁你可想太多了。 buxp 发表于 2025-1-19 06:12
很多程序插上就能用的。。不需要NVLINK
不管是大参数模型的推理还是训练,卡间通信走nvlink至少p2p还是很有意义的。目前专业卡至少还有p2p这样在并行推理上还是很有优势的 PolyMorph 发表于 2025-1-18 18:16
rt core x 频率
频率不是只差了0.1G吗?每个算力怎么会差30%+? 算力不是看fp16 with fp32 accumulate那一行吗?4090被砍半才160,5090可能是满速。 本帖最后由 PolyMorph 于 2025-1-20 03:28 编辑
用户 发表于 2025-1-19 13:08
算力不是看fp16 with fp32 accumulate那一行吗?4090被砍半才160,5090可能是满速。
quadro tesla计算卡才会满速,5090要是满血,tf32fp32 on tensor,这些卡不用卖了
https://pan.imgbed.link/file/219721
https://pan.imgbed.link/file/219721
赫敏 发表于 2025-1-18 08:18
现在fp4能算什么
self host跑推理模型都q4量化 其实连int4都用不上拿fp32速度也完全够 还是得单卡塞大显存参数量堆上去 5090 D真的是纯纯的智商税了 AI性能还不如4090吗 jaycty 发表于 2025-1-22 13:48
5090 D真的是纯纯的智商税了 AI性能还不如4090吗
卡着禁售线不就是这样吗,官网虽然玩文字游戏但是参数和标准都写的很明白,实际 5090D 就是 4090D 一个水平的算力 PolyMorph 发表于 2025-1-19 16:15
quadro tesla计算卡才会满速,5090要是满血,tf32fp32 on tensor,这些卡不用卖了
记得那些卡制程比RTX卡低吧?反而频率高?
页:
1
[2]