找回密码
 加入我们
搜索
      
查看: 8434|回复: 12

[显卡] P106-100能跑本地大语言模型不?

[复制链接]
发表于 2024-6-5 17:13 | 显示全部楼层
显存不够就offload一些层去内存呗,对速度要求不高的话7b级别也能跑
我用笔记本3060 6g,内存ddr4 3200,最高跑过yi-1.5-9b和llama3 8b的q5km,速度大概10t/s
跑qwen-1.5-4b如果不把context开太大(这玩意没有gqa…context很吃显存)的话可以直接显存全装下,40+t/s的速度
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-8-17 05:42 , Processed in 0.006603 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表