找回密码
 加入我们
搜索
      
查看: 6814|回复: 30

[CPU] 水友用单路9654+KT框架跑 Q4 deepseek 671B 出14Token/S !

[复制链接]
发表于 2025-2-17 17:08 | 显示全部楼层




  1. prompt eval time =   49944.85 ms /  1653 tokens (   30.21 ms per token,    33.10 tokens per second)
  2.        eval time =  101428.64 ms /   329 tokens (  308.29 ms per token,     3.24 tokens per second)
  3.       total time =  151373.49 ms /  1982 tokens

复制代码


我用双路7002的epyc+6张4090跑出来的速度,2.22bit模型,用8卡4090 48能把全部模型装进gpu说不定有点意义
发表于 2025-2-17 17:30 | 显示全部楼层


KimmyGLM 发表于 2025-2-17 17:15
富哥你好,上面那几个配置只需要两张4090 48G…


超低精度量化最低估计能部到strixhalo+一张48G的卡上,或者两片strixhalo。
虽然但是,农企不靠谱的软件适配和产品经理
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-12-15 14:36 , Processed in 0.007618 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表