找回密码
 加入我们
搜索
      
楼主: lh4357

[显卡] 5090D用ollama跑deepseek r1 32b的效果。

[复制链接]
发表于 2025-2-16 04:39 | 显示全部楼层
lh4357 发表于 2025-2-8 13:41
反正跑32b是永远吃不满。

5090我测下来可以跑到50t, 功耗480w,你再测测看看是不是软件更新适配了50系?
发表于 2025-2-16 10:05 来自手机 | 显示全部楼层
6800xt跑越狱版32b不到6t,勉强能用用
发表于 2025-2-16 10:19 | 显示全部楼层
家用跑模型还得看mac
发表于 2025-2-16 10:31 | 显示全部楼层
Technik 发表于 2025-2-7 13:18
4090D
total duration:       37.2562216s
load duration:        20.0582ms

我也好奇试了下,也是4090D

微信图片_20250216103057.png
 楼主| 发表于 2025-2-16 12:00 | 显示全部楼层
zcyandrew 发表于 2025-2-16 04:39
5090我测下来可以跑到50t, 功耗480w,你再测测看看是不是软件更新适配了50系? ...

更新软件了,试了下,果然有提升。
101.png

102.png
发表于 2025-2-16 13:31 | 显示全部楼层
lh4357 发表于 2025-2-16 12:00
更新软件了,试了下,果然有提升。

那这次真锁了个寂寞?你有测过训练吗
 楼主| 发表于 2025-2-16 13:35 | 显示全部楼层
zcyandrew 发表于 2025-2-16 13:31
那这次真锁了个寂寞?你有测过训练吗

我不知道拿啥测训练。

常用的都是声音模型,但torchaudio居然到现在还没人编译个cuda12.8出来。。
发表于 2025-2-16 22:49 | 显示全部楼层
本帖最后由 p_ricky777 于 2025-2-16 22:52 编辑

发表于 2025-2-25 11:47 | 显示全部楼层
这个效果已经很好了,网上大把人部署的本地模型 10 tokens/s 都没有。
问题的复杂程度和输出的tokens/s 没有什么关系,问你好和问你十八代祖宗姓什么都差不多。
发表于 2025-2-25 11:48 | 显示全部楼层
lbb68 发表于 2025-2-7 11:32
缩水版的 都是弱智,有啥用?

32B还有有些用的,企业方案落地里
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-4-27 17:58 , Processed in 0.012375 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表