找回密码
 加入我们
搜索
      
查看: 477|回复: 1

[装机] WSL+ktransformers 6.4tokens/s deepseek 1Q1S量化

[复制链接]
发表于 2025-4-1 21:45 | 显示全部楼层 |阅读模式
直接在wsl里面安装,cuda最开始12.8导致后面装不下去,切换到12.4,接下来就是模型要拷贝到wsl系统里面,
否则就是启动两小时。
运行的时候提示我找不到flash_infer,不必理会。
感觉问题还是很多,连10tokens都没到。
8581C+384GB@5600+3090ti*2
发表于 2025-4-1 22:27 | 显示全部楼层
满血  》 量化 (unsloth、kt) 》 蒸馏,真是个无底洞。
玩过一圈之后,老老实实选择了API充值,坐享其成算了。最多本地加个蒸馏模型与知识库。
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-4-26 23:51 , Processed in 0.007780 second(s), 4 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表