找回密码
 加入我们
搜索
      
查看: 16800|回复: 69

[显卡] 5090D用ollama跑deepseek r1 32b的效果。

[复制链接]
发表于 2025-2-11 14:48 | 显示全部楼层
我4080,16gb显存,也用 32b Q4,爆显存后,优化cpu显存,能有10tokens/s,速度个人用已经满意了,就是智商还不满意
发表于 2025-2-11 14:52 | 显示全部楼层
naobaijin 发表于 2025-2-7 20:26
关键得同模型同量化才有对比意义吧。我4070tis, 32BQ4,产不忍赌,没有用到共享显存。显存占用14G左右。运 ...

4k上下文应该能上10t/s,8k上下文9.5t/s左右,32k上下文就8t/s
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-5-28 01:35 , Processed in 0.020470 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表