一般一个企业垄断多久会不行了就。
您找的是不是«苹果» 所以。。。为啥5090那么缺货。。。芯片都拿去做这个了吧,毕竟这玩意儿利润比消费端的产品搞多了 lqf3dnow 发表于 2025-3-19 19:57
单卡跑R1 70b模型能有多少tok/s?
即使量化4位,也需要336G+显存 楼主的马甲 发表于 2025-3-22 21:14
即使量化4位,也需要336G+显存
70b模型使用8卡8GB P4卡,ollama显示size是60GB,所以96G显存应该足够了
本帖最后由 Suzuka 于 2025-3-23 11:14 编辑
chh-carter 发表于 2025-3-19 12:15
还是阉割了cuda数量,就不能爽快的出个完整GB202吗?还准备明年再出RTX PRO TITAN?? ...
核心这么大规格能挑出完整版不太容易,就算出也就是个吉祥物。 玄武不悔 发表于 2025-3-19 11:09
老黄的卡。别的不说,颜值方面一直都挺好的。。AMD怎么就不学学呢
好看的你们又不买
https://images.idgesg.net/images/article/2017/07/radeon_vega_64_a.-100730362-orig.jpg
https://th.bing.com/th/id/R.553ef8ab4c4f1f95d63b608e50c063d6?rik=hl70roz2nothUA&riu=http%3a%2f%2fcdn.wccftech.com%2fwp-content%2fuploads%2f2017%2f06%2fAMD-Radeon-Vega-Frontier-Edition_5.jpg&ehk=rEmAxA6Y68wETAkb710pkmfHvVkEiWOi3iRLZqFsIdo%3d&risl=&pid=ImgRaw&r=0 Suzuka 发表于 2025-3-23 10:52
核心这么大规格能挑出完整版不太容易,就算出也就是个吉祥物。
强迫症表示很难受。怕不是以后都没有完整核心的旗舰了 chh-carter 发表于 2025-3-23 12:47
强迫症表示很难受。怕不是以后都没有完整核心的旗舰了
所以AMD连高端卡都不出了,AMD CPU用小die并联模式提高良品率
其实HDD也是这样,只不过一般人不知道完整规格。 lqf3dnow 发表于 2025-3-23 10:19
70b模型使用8卡8GB P4卡,ollama显示size是60GB,所以96G显存应该足够了
俺说的是真正的R1,满血版
这个蒸馏的没啥意思
https://www.bilibili.com/video/BV1yhFMe9EPp 赫敏 发表于 2025-3-23 11:03
好看的你们又不买
这个并不算特别好看,在一堆AMD公版里面算好看的,但是放在A\N两家公版里面只能算中上,方方正正的造型只能说中规中矩,拉丝表面处理也不好看。哈哈哈 楼主的马甲 发表于 2025-3-23 13:29
俺说的是真正的R1,满血版
这个蒸馏的没啥意思
https://www.bilibili.com/video/BV1yhFMe9EPp ...
知道了,那4块这个96G显存的卡,可以全显卡跑R1满血版了,不知道速度如何。之前满血版跑华为Atlas 4x8卡机,硬件报价上百万。这个卡可以大规模拉低部署硬件成本 chh-carter 发表于 2025-3-19 12:15
还是阉割了cuda数量,就不能爽快的出个完整GB202吗?还准备明年再出RTX PRO TITAN?? ...
老黄的尿性,就算完整版也是给专业卡,不会留给我们这帮臭打游戏的~[流泪] LevyQT 发表于 2025-3-19 21:41
这是满血版的5090Ti的规格?
忘记5090TI吧,老黄看不上咱们~[流泪]
页:
1
[2]