找回密码
 加入我们
搜索
      
查看: 4931|回复: 36

[CPU] mac mini4到手了, 跑大模型效果

[复制链接]
发表于 2024-12-1 04:16 | 显示全部楼层 |阅读模式
本帖最后由 netjunegg 于 2024-12-1 12:13 编辑

手头有个游戏本是4060m显卡, 和mac mini4跑同样的大模型进行对比

同样用ollama跑qwen2.5:7b, 本以为mini 4的速度会明显慢, 谁知道并不慢, 反倒比4060m快50%

同样从0开始启动, 两边一模一样的提示词, 用go语言生成websocket客户端和服务端示例

mini 4总共耗时46秒, 4060m总共耗时70秒, 计时误差不超过2秒, 挺出乎意料的.

看了下两边数据都是百分百在gpu中, 显存占用6G多点.


另外试了下, mini4可以跑qwen2.5:14b, 显存占用10G多点, 这个4060m就无能为力了.

如果确实如此的话, 我感觉mini4挺值, 有点后悔没买pro加大内存的了, 不知道pro跑更大的模型效果怎么样


有没有小伙伴能做下类似的测试? 看跟我的结果是否一样?


---------------- 更新, 反转:
重启4060m的系统后, 再次测试4060m, 发现速度提高了非常多, 又大幅超越mini4, 领先一半以上,  无语了, 这个倒是比较符合预期

之前测试的时候已经重启过ollama服务端和客户端, 看来跟重启系统效果还是大不一样, 有点玄学, 难道系统运行久了就慢?


发表于 2024-12-1 04:24 | 显示全部楼层
支持你买M4 MAX的笔记本。
发表于 2024-12-1 04:29 | 显示全部楼层
https://vmem-for-llms.kcores.com ... 0cfbc7990f015a88c70

请!

我个人试下来,m4 pro 24G在LM studio和sillytavern的情况下跑nemo 2407基本上和3080m 16G一个速度
发表于 2024-12-1 05:42 | 显示全部楼层
感觉不如3070性价比高阿
 楼主| 发表于 2024-12-1 09:09 | 显示全部楼层
raiya 发表于 2024-12-1 04:24
支持你买M4 MAX的笔记本。

一方面数据差别太意外, 需要进一步验证
另一方面, 性能增长不一定是线型关系, 也需要进一步确定, 毕竟36g以上内存的太贵了, 买回来性能达不到要求就麻烦了

暂时交流为主
 楼主| 发表于 2024-12-1 09:10 | 显示全部楼层
游荡在灯塔 发表于 2024-12-1 04:29
https://vmem-for-llms.kcores.com/index-cn?continueFlag=64a91bfe849e20cfbc7990f015a88c70

请!

我看链接里面是单纯考虑显存带宽, 而且是纯理论带宽, 不是实测性能. 所以3060比4060高很多, 因为前者位宽高
 楼主| 发表于 2024-12-1 09:18 | 显示全部楼层
dsy12289011 发表于 2024-12-1 05:42
感觉不如3070性价比高阿

是啊, 二手性价比无敌

不过新款mini是真让人喜欢, 最小mini主机, 而且电源内置, 还自带音箱, 音箱效果好于很多笔记本, 就像一个美女, 又漂亮身材又好, 又很有才, 个人表示非常喜欢
发表于 2024-12-1 09:25 | 显示全部楼层
netjunegg 发表于 2024-12-1 09:09
一方面数据差别太意外, 需要进一步验证
另一方面, 性能增长不一定是线型关系, 也需要进一步确定, 毕竟36g ...

按照目前看到的信息,这东西要么就最低配,性价比最高。要么就配到48G以上,内存越大越好MAX ULTRA的。

因为中间那个价格段,都不如拿这个钱去买显卡。

M4的内存带宽,最低的100G,就是双通道DDR5的带宽,pro 200G, MAX 400G,ULTRA 800G。GPU核心性能是肯定不如N卡的。所以一定要内存够大,那么在跑爆显存的模型的时候才有价值。
 楼主| 发表于 2024-12-1 09:34 | 显示全部楼层
本帖最后由 netjunegg 于 2024-12-1 09:42 编辑
raiya 发表于 2024-12-1 09:25
按照目前看到的信息,这东西要么就最低配,性价比最高。要么就配到48G以上,内存越大越好MAX ULTRA的。

...


确实如此, 中间一系列还是挺尴尬的, 如果价格再亲民点就好了, 说不定能卖疯, 特别是32G版本

本地跑个模型还是挺方便的, 挺有用

另外m4系列带宽好像稍有提升, 比如基础款120G, pro 273GB/s, max 546G, 比400高了不少. 不知道ultra会不会超1T
发表于 2024-12-1 10:44 来自手机 | 显示全部楼层
能买来挖旷了
发表于 2024-12-1 11:00 | 显示全部楼层
企业里都是有机房的。
学生写论文直接4090,毕竟代码写累了可以玩游戏。
夹在中间,Mac Studio 满配128GB内存。

这个Mac Mini 跑大模型,给谁用?学生说不能玩游戏,企业说 我有机房,中间夹心层说,Studio不好吗?

Mac能跑AI,算是一个卖点,只是点缀吧,聊胜于无。
发表于 2024-12-1 11:07 | 显示全部楼层
M4的意义在于,游戏显卡跑不了的大模型它能跑,前提是内存足够大
发表于 2024-12-1 11:08 来自手机 | 显示全部楼层
mini 哪个配置
发表于 2024-12-1 11:10 来自手机 | 显示全部楼层
binne 发表于 2024-12-1 11:00
企业里都是有机房的。
学生写论文直接4090,毕竟代码写累了可以玩游戏。
夹在中间,Mac Studio 满配128GB内 ...

mac用户好不容易给自己创造了一项需求,你这样不太好吧
发表于 2024-12-1 11:14 | 显示全部楼层
深水河 发表于 2024-12-1 11:10
mac用户好不容易给自己创造了一项需求,你这样不太好吧

只是苹果统一内存的意外功能。很好,比HMB便宜多了。
发表于 2024-12-1 11:36 | 显示全部楼层
dsy12289011 发表于 2024-12-1 05:42
感觉不如3070性价比高阿

成熟模型,m2跑起来都很快。但是如果训练,内存明显不够。
发表于 2024-12-1 11:43 | 显示全部楼层
一样的prompt但不用greedy采样的话两边生成的东西大概率是不一样的, 你有确认过两边生成的长度差不多吗
(或者说最好加上ollama的log)
 楼主| 发表于 2024-12-1 12:07 | 显示全部楼层
本帖最后由 netjunegg 于 2024-12-1 12:20 编辑
zhuifeng88 发表于 2024-12-1 11:43
一样的prompt但不用greedy采样的话两边生成的东西大概率是不一样的, 你有确认过两边生成的长度差不多吗
(或 ...


生成结果倒是很接近, 但是

---------------- 更新, 反转:
重启4060m的系统后, 再次测试4060m, 发现速度提高了非常多, 又大幅超越mini4, 领先一半以上,  无语了, 这个倒是比较符合预期

之前测试的时候已经重启过ollama服务端和客户端, 看来跟重启系统效果还是大不一样, 有点玄学, 难道系统运行久了就慢?
发表于 2024-12-1 15:56 | 显示全部楼层
京东那个3千多有补贴的一直抢不到。。。。大家都是4千多入手吗?
发表于 2024-12-1 17:33 来自手机 | 显示全部楼层
nikition 发表于 2024-12-1 15:56
京东那个3千多有补贴的一直抢不到。。。。大家都是4千多入手吗?

不要浪费时间精力,抢不过黄牛的,别人用脚本,你手动.
发表于 2024-12-1 19:21 | 显示全部楼层
nikition 发表于 2024-12-1 15:56
京东那个3千多有补贴的一直抢不到。。。。大家都是4千多入手吗?

闲鱼,第一批拿到的人那里收的,加了一百多块钱,也就教育优惠的价格。

这种事情么,想穿就是加点钱,节约一个月时间。第一批拿到的人本来就最便宜,而且还必须在第二批拿到的人之前出手,所以价格也不会很高。
发表于 2024-12-1 21:57 | 显示全部楼层
本帖最后由 BetaHT 于 2024-12-1 22:00 编辑

运行大型模型肯定需要用到显卡。
Mac Mini的主要定位是体验macOS系统。

当前,网络购物们在全力为Mac Mini寻找应用场景,这恰恰说明它的实际用途可能并不值那么多钱,因为最了解自己产品的苹果公司自己也没有过多强调这些用途。

另外,印象中作为Mac体验入门版的Mac Mini起步价应该不到3000元,现在都已经涨到4000多元了,却还在谈论性价比,这实在是令人费解。
 楼主| 发表于 2024-12-2 02:02 | 显示全部楼层
BetaHT 发表于 2024-12-1 21:57
运行大型模型肯定需要用到显卡。
Mac Mini的主要定位是体验macOS系统。

丐版还好吧, 同等价位x86 nuc很难跑大模型, 但mini可以, 甚至可以跑14b的, 速度还是可以的, 可以正常使用. 而且居然带音箱, 效果还不错, 出乎意料.

另外发现, 天天玩的游戏wotb支持macos, 运行非常流畅, 每天玩两三个小时.

mini和apple tv很接近, 如果价格再向apple tv靠拢一点就更好了

发表于 2024-12-2 07:11 | 显示全部楼层
二手M1和M2价格已经向TV靠拢了
发表于 2024-12-2 07:46 | 显示全部楼层
你这侧的不严谨啊,得先把模型加载好,再测输出速度呀。正常使用大模型,一般都常驻内存显存的。

发表于 2024-12-2 07:56 | 显示全部楼层
netjunegg 发表于 2024-12-1 09:10
我看链接里面是单纯考虑显存带宽, 而且是纯理论带宽, 不是实测性能. 所以3060比4060高很多, 因为前者位宽 ...

其实没毛病,大模型发展这块儿,现在可以说遇到了“内存墙”,也就是带宽瓶颈。M4带宽就120GB,跑模型用,丐版16G就挺好,内存再高没意义。

 楼主| 发表于 2024-12-2 08:07 | 显示全部楼层
uprit 发表于 2024-12-2 07:46
你这侧的不严谨啊,得先把模型加载好,再测输出速度呀。正常使用大模型,一般都常驻内存显存的。

...

应该加载好了, 两边都是先说句"你好", 它给出回应, 说明都加载好了

不过4060m这边重启了下系统后重测, 结果有所反转
发表于 2024-12-2 09:53 | 显示全部楼层
netjunegg 发表于 2024-12-2 08:07
应该加载好了, 两边都是先说句"你好", 它给出回应, 说明都加载好了

不过4060m这边重启了下系统后重测,  ...

这太少了,试试说100句不同的然后对比下
 楼主| 发表于 2024-12-2 11:20 | 显示全部楼层
fkpwolf 发表于 2024-12-2 09:53
这太少了,试试说100句不同的然后对比下

说一句就应该完整加载吧? 不可能加载一部分就能输出结果吧?
发表于 2024-12-2 11:43 | 显示全部楼层
netjunegg 发表于 2024-12-2 11:20
说一句就应该完整加载吧? 不可能加载一部分就能输出结果吧?

a s k c h a t g p t
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2024-12-7 20:11 , Processed in 0.014025 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表