amagene 发表于 2025-2-18 16:11
直接买17000左右的Mac mini,比你的速度要快
而且更加节能
翰墨留香 发表于 2025-2-18 16:21
限制一下处理器线程数量,671b估计也能跑个2tokens……64*8=512GB能用了
pdvc 发表于 2025-2-18 16:17
很多槽点。
直接去hf下gguf文件。
cn88695 发表于 2025-2-18 16:24
我有空试试看能不能达到这个速度
wuxi001 发表于 2025-2-18 16:20
直接购买128G (或64G) 的 MAC MINI (内存及显存架构),一个不行,两个集成 CLUSTER或者更多 , EXO 组 ...
amagene 发表于 2025-2-18 16:11
直接买17000左右的Mac mini,比你的速度要快
而且更加节能
cn88695 发表于 2025-2-18 16:26
KT又不是只有英特尔可以用,只是不能用CPU的优化而已。等我过几天实测吧,期待有个6-8就满足了。 ...
BetaHT 发表于 2025-2-19 07:48
设置的肯定有问题。我32g内存+137k都能跑2t/s
我輩樹である 发表于 2025-2-18 23:52
去镜像站下:
https://hf-mirror.com/unsloth/DeepSeek-R1-GGUF/tree/main/DeepSeek-R1-Q8_0
ccceee 发表于 2025-2-18 22:44
我用至强W2145+6700xt+4通道ddr4 2666内存,跑14b有30tokens/s,还比较流畅;跑32b爆显存就只有3tokens/s, ...
ruo101 发表于 2025-2-18 21:13
厉害厉害· ··我有点像试试8B的好不好使· ·核显分配16G显存 ,物理机64G内存 ...
Vossk 发表于 2025-2-18 18:05
mac mini m4 pro 64G跑不了671b,楼主64G*8+1x gpu可以跑4bit 671b
coolcoolbear 发表于 2025-2-18 17:59
我用14700kf/7900xtx/32g d5(6800), 跑32b,大概30 tokens/s, 70b, 2.xx tokens/s。
70b的效果不错,内存不 ...
暂时是猫 发表于 2025-2-18 17:00
671B可以一试,因为是MOE架构,未必会比70B慢这么多。估计有3 tokens/s
agrant 发表于 2025-2-18 16:58
ollama pull 要看网络
或者从其他地方下载下来,然后导入转换一下
darkness66201 发表于 2025-2-18 16:37
最新一代的至强或者EPYC 上12通道DDR5 6000比起八通道DDR2666要强太多了,光是带宽就多了三倍都不止... ...
cn88695 发表于 2025-2-19 11:30
你再弄4根内存条回来,成本大概1300(64*4),应该会对速度有很大帮助。
cn88695 发表于 2025-2-19 11:35
有没有可能价格也贵太多了,同样的64G,D4卖300多,D5卖1800+。我也知道D5比D4强啊,这价格差的也太大了 ...
darkness66201 发表于 2025-2-19 12:41
那肯定贵的啊,不然价值体现在哪里,本来时间就是巨大的价值,H100和3060比也没有上百倍的性能差距啊.... ...
cn88695 发表于 2025-2-19 11:27
你跑的模型有多大?
cn88695 发表于 2025-2-20 12:51
运行deepseek-r1:671b(404GB)速度实测:
CPU占用75%,内存占用435GB(共512G),随便问了一个简单的问题 ...
testmepro 发表于 2025-2-20 13:35
不错呀,我也打算按老哥套路来一套 pro ws wrx80 e sage wifi ii +5975wx+512g内存,显卡暂时用原来的2080t ...
cn88695 发表于 2025-2-20 14:05
5975的架构更新,主频也更高,没准比3995wx效果还要好些。不过wrx80最多支持八通道,要是支持16通道就好 ...
testmepro 发表于 2025-2-20 15:05
什么时候内存带宽能过1T/s 速度就上来了
testmepro 发表于 2025-2-20 15:05
什么时候内存带宽能过1T/s 速度就上来了
deepfishing 发表于 2025-2-20 15:26
我用的撕裂者跑1.58bit的模型效果不咋样,撕裂者配4张3090,不如看看4张4090 48G插上,然后尽量把模型放GPU ...
darkness66201 发表于 2025-2-20 15:30
12通道DDR5上双路就可以了,当然光内存就二十多条,和八通道DDR4成本就两码事了。 ...
darkness66201 发表于 2025-2-20 15:30
12通道DDR5上双路就可以了,当然光内存就二十多条,和八通道DDR4成本就两码事了。 ...
testmepro 发表于 2025-2-20 16:15
内存加起来比主板+cpu还贵吧
testmepro 发表于 2025-2-20 16:15
内存加起来比主板+cpu还贵吧
cn88695 发表于 2025-2-18 16:13
mac的拓展性太差了,以及我肯定不是买了个工作站专门跑ds嘛,还有其他需求。 ...
ykdo 发表于 2025-2-20 17:48
4090加3090各一张,能跑多大参数的DS啊
ccceee 发表于 2025-2-18 22:44
我用至强W2145+6700xt+4通道ddr4 2666内存,跑14b有30tokens/s,还比较流畅;跑32b爆显存就只有3tokens/s, ...
trashgod 发表于 2025-2-20 18:09
为啥这些AI的结果输出都是一个个字蹦的。
难道不是一次性推理算出一段话,不可能真的是一个个字计算出来 ...
trashgod 发表于 2025-2-20 18:09
为啥这些AI的结果输出都是一个个字蹦的。
难道不是一次性推理算出一段话,不可能真的是一个个字计算出来 ...
ttt5t5t 发表于 2025-2-20 20:47
兄弟 你这个好像买错平台了
intel 5代Xeon或者AMD 3代EPYC才比较合适
县城说白了也只是工作站 桌面++罢了 ...
cn88695 发表于 2025-2-19 11:32
哈哈,期待反馈
cn88695 发表于 2025-2-20 12:51
运行deepseek-r1:671b(404GB)速度实测:
CPU占用75%,内存占用435GB(共512G),随便问了一个简单的问题 ...
coolcoolbear 发表于 2025-2-21 17:37
对了,7900xtx的机器,24g显存会被占满,但是gpu用利率很小,基本不工作,cpu利用率50%左右。
3080ti, 12g ...
欢迎光临 Chiphell - 分享与交流用户体验 (https://www.chiphell.com/) | Powered by Discuz! X3.5 |