找回密码
 加入我们
搜索
      
楼主: 秦南瓜

[显卡] 新手本地部署LLM的一些问题

[复制链接]
 楼主| 发表于 2025-2-6 15:04 | 显示全部楼层
装陈醋的酱油瓶 发表于 2025-2-6 14:55
如果只是想70b玩玩,那么你现有的3090/ 4090 搭配一张新的2080 ti 22G 差不多

如果以后想要玩的high且只考 ...

可以不同型号混搭对吧,实际推理速度如何?
发表于 2025-2-6 17:23 | 显示全部楼层
秦南瓜 发表于 2025-2-6 15:04
可以不同型号混搭对吧,实际推理速度如何?

70B的10token/s, 671b 1.58bit 量化的 1.23 token/s
2990wx + 192GB +  3090ti + 3090 +2080ti 22G*2 这一群虾兵蟹将
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-4-26 19:10 , Processed in 0.096189 second(s), 3 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表