找回密码
 加入我们
搜索
      
查看: 27255|回复: 143

[电脑] 跨越不止一点——M4升级M4 Pro+4TB/32B至每秒17词

  [复制链接]
发表于 2025-3-9 10:03 | 显示全部楼层 |阅读模式
本帖最后由 hawie 于 2025-3-15 12:16 编辑

目录

一、前言
二、Apple Silicon第四代:M4、M4 Pro、M4 Max规格对比
三、前所未有的国补和教育双重优惠
四、双选开箱:M4万兆版 vs M4 Pro万兆版
五、跨越四代的性能测试:M1、M2、M4、M4 Pro
六、结语



一、前言

自2020年Apple Silicon横空出世以来,M系列芯片以颠覆性的性能与能效比重塑了个人计算设备的边界。从M1到M4的迭代,苹果不断刷新行业标杆。而第四代Apple Silicon——M4、M4 Pro、M4 Max——以更激进的单核性能提升,通过iPad Pro、Mac mini、MacBook Air/Pro和Mac Studio等精准定位的产品全方位登场。

同时,因为有了国家的宏观促进消费政策,我们某天猛然发现,苹果居然也有了性价比。

如果说M4是苹果对当今性能普惠的承诺,那么M4 Pro、M4 Max则是为专业追求用户的量身定制。以下从技术对比、优惠政策、开箱及性能测试多维度,结合Mac mini历代产品的体验,分享从M4升级到M4 Pro的跨越式价值。


二、Apple Silicon第四代:M4、M4 Pro、M4 Max规格对比

1. 核心数量:
M4 采用 10 核 CPU(4 性能 + 6 效率),最高 10 核心 GPU。
M4 Pro 采用 12 核 CPU(8 性能 + 4 效率)、16 核 GPU,或者 14 核 CPU(10 性能 + 4 效率)、20 核 GPU。
M4 Max 采用 14 核 CPU(10 性能 + 4 效率)、32 核 GPU,或者 16 核 CPU(12 性能 + 4 效率)、40 核 GPU。
均采用 16 核心 NPU。
2. 内存带宽与最大支持容量:
M4:120GB/s,最高支持 32GB 统一内存。
M4 Pro:273GB/s,最高支持 64GB 统一内存。
M4 Max:410GB/s(14核CPU) 或 546GB/s(16核CPU),最高支持 128GB 统一内存。
3. 重要参数图表:
spec2.png

三、前所未有的国补和教育双重优惠

以下根据京东自营的国补、教育双重优惠之后的价格,分别按照M4、M4 Pro、M4 Max的典型Mac mini配置、Mac Studio配置,列出当前最新优惠。
1. 价格优惠表
截屏2025-03-08 22.53.47.png
2. 优惠折扣图(制作的英文版, 中文有乱码,下同):
截屏2025-03-08 22.57.20.png
其中,M4、M4 Pro为Mac mini机型,M4 Max为Mac Studio机型的基础版。


四、双选开箱:M4万兆版 vs M4 Pro万兆版

因为有了国补优惠,相比前一代,入手哪一款都觉得性价比很高。
个人而言,有连接万兆内网NAS的需要,万兆是刚需,所以,选择了最基础的M4加万兆的配置入手。
使用三个月后,改为重新入手M4 Pro基础款加万兆的配置。
这两款,只有快递牛皮纸外包装(M4 Pro的可重复使用看似改进设计了)、及盒中最底层里面的纸片有M4、M4 Pro印刷的区别,其他没有任何外观上的区别。
以下简约开箱:
1. 外包装,Pro版可重复使用:
包装大小跟一个电脑音箱差不多。
M4 Pro,
外包装1.JPEG
外包装2.JPEG
M4,
m4.jpg
2. 内包装,机身:
机身设计大改,延续 Apple一贯的极简风格。
unbox.jpg
inner1.jpg
3. 桌面,外观小巧精致:
跟旁边的D41机箱比起来,不,真是小到没法比。宽度跟iPad mini 7差不多(小0.8cm),高度是iPad mini 7的四分之一。
m4pro-desktop.png

4. 系统安装,从时间机器恢复:
安装过程一如既往,没有什么特殊的,就不表了。过程中,发现苹果安装时的一个小BUG,如图,右上角的时间显示是错误的。既不是东8区的时间,也不是UTC时间,显示的是东8区的时间再加8个小时的时间,有意思。
timezonebug.png


五、跨越四代的性能测试:M1、M2、M4、M4 Pro

惯例安装系统时,选择了从时间机器恢复,时间机器保存了从M1开始的Mac mini以来历代数据,包含测试应用。正好方便以相同的测试工具,对不同代的机器性能进行评估。

1. Geekbench 5,CPU:
其中链接指向的,是我名下提交给Geekbench的成绩。下同
geekbench5-table.png
geekbench5-chart.png

2. Geekbench 6,CPU:
geekbench6-table.png
geekbench6-chart.png
可以看出,M4 和 M4 Pro 在 GeekBench 6 的单核和多核表现均大幅领先于 M2,特别是 M4 Pro 的多核性能接近 M2 的 2.15 倍。

3. Geekbench 5,GPU:
geekbench5-table-gpu.png
geekbench5-chart-gpu.png
可以看出,Apple M4 Pro 在 GPU 计算性能上大幅领先,尤其是使用 Metal API 时的得分最高。

4. Geekbench 6,GPU:
geekbench6-table-gpu.png
geekbench6-chart-gpu.png
可以看到,Apple M4 Pro 在 Metal API 下的 GPU 计算性能提升明显,达到 94,269 分,远超 M4 和 M2。

5. Geekbench AI
geekbench-ai-table.png
geekbench-ai-chart.png
可以看到,Apple M4 Pro 在 Neural Engine 上的 AI 计算性能远超其他芯片,总分达 48,375,训练性能尤为突出。

6. 相同AI模型下的性能
M4:
m4-ai.png
M4 Pro:
m4pro-ai.png

7. M4 Pro, 其他AI模型性能
DeepSeek-R1 32b,
截屏2025-03-05 14.10.31.png
Qwen2.5-Coder 32B,
截屏2025-03-07 09.39.38.png
QwQ-32B,
截屏2025-03-09 15.34.29.png
2025.03.14.+ 将32b模型优化为100% GPU占用,性能提升至17 tokens/s:
DeepSeek-R1 32b,
截屏2025-03-14 15.57.57.png
Qwen2.5-Coder 32B,
截屏2025-03-14 16.24.14.png
QwQ-32B,
截屏2025-03-14 16.18.47.png
此时GPU功耗约为25W,CPU功耗约为1W:
截屏2025-03-14 16.00.42.png

8. AI模型性能图表,2025.03.15.+ AI模型性能汇总:
截屏2025-03-15 11.30.31.png
截屏2025-03-15 11.30.50.png

9. 固态硬盘性能
M4 Pro
512GB,
截屏2025-03-05 10.23.00.png
截屏2025-03-05 10.25.18.png
4TB, 2025.03.14.+ 采用的内置小板替换方式,不破坏原盘,应该不影响苹果质保。系统识别为苹果的官方型号APPLE SSD AP4096Z,使用上与原盘一致。这个M4 Pro版的4TB内置小板,选的是天极团队、小天才李燎 Pro产品,因为最先他做出来的M4版用下来很稳定、速度也更快。首测成绩,写速超过10000 MB/s,这接口是PCIe 5.0了吗:
截屏2025-03-14 10.58.27.png
截屏2025-03-14 10.17.16.png
M4:
256GB,
ssd-diskmark.png
ssd-diskspeed-stress-1gb.png
2TB
ssd-diskmark-mod-2TB.png
ssd-diskspeed-stress-1gb-mod-2TB.png

10. 游戏性能
除了原生macOS/iOS游戏,官方及第三方也有了工具,运行Windows游戏。
这里仅用原生的古墓丽影自带Benchmark,测试M4 Pro在4K分辨率下的帧率,作为参考。
截屏2025-03-09 03.58.19.png
截屏2025-03-09 09.20.21.png


六、结语

M4 系列的推出,标志着 Apple Silicon 的新一轮进化。
M4 Pro相比M4,在日常使用之余,可以兼顾如今热门的AI大模型本地部署。得益于24GB以上的统一内存,32b输出能达到 17 tokens/s,而32billion参数也正好是很多大模型实用的门槛。
这样一款高性能、低功耗、还有了性价比的设备,无论是工作、娱乐、AI,都是值得考虑的不可多得的利器。
M4 Pro,跨越不止一点。






评分

参与人数 9邪恶指数 +265 门户文章 +1 收起 理由
猪圈 + 10 666
nshbj + 10 就是NB
ctfeng + 10
ilas + 200
nApoleon + 1
TernenceS + 10
hudizhoutube + 10
nineapple + 10 做的折扣表,棒
Wolverine + 5

查看全部评分

 楼主| 发表于 2025-3-9 17:18 | 显示全部楼层
本帖最后由 hawie 于 2025-3-9 17:28 编辑
cyuet 发表于 2025-3-9 16:15
本来还准备把M1Max的 Studio换成M4Pro, 现在看来AI的水平起是还打不过M1Max的丐版

total duration:        ...


m1max是400GB/s 内存带宽吧,m4pro是273GB/s。其实新出的Mac studio不错,你升级路线改为M4Max自然会全面胜出。mac studio要是早几天推出来,我应该也会选择m4max。
 楼主| 发表于 2025-3-10 10:48 | 显示全部楼层
terryteng 发表于 2025-3-10 08:55
2月底购入了一批Mac mini M4Pro+64G+2T,上周赶紧退了,换Mac Studio M4Max+64G+1T,贵1k ...

那是非常不错。方便同样跑一个上面的32B的模型,看看速度提高多少?
 楼主| 发表于 2025-3-10 20:21 | 显示全部楼层
MilkyWayne 发表于 2025-3-10 15:31
能否再评价下散热?

担心这一代的壳是给M4设计的,M4Pro会吃力......

满载在表面感觉不到有什么温度,依然是游刃有余。不知道满血版会不会有压力。
 楼主| 发表于 2025-3-10 20:26 | 显示全部楼层
Jacobddu 发表于 2025-3-10 15:36
默认的时区是Pacific Time UTC -8,哪里是bug了?

真要细细体验,也可以算是bug了,因为这个时侯发生在,更新系统及恢复时间机器数据。而在这之前的安装步骤,首当其冲就已经选择过“中国大陆”了,以苹果的水准,应该调整为对应的时区。
 楼主| 发表于 2025-3-10 20:42 | 显示全部楼层
多蒙 发表于 2025-3-10 15:45
好靓且专业的评测。
另请教楼主,目前我就玩一个魔兽世界,主机配的是4070ti显卡,感觉还是太大了。
最近想 ...

魔兽世界在macOS有原生支持。听说m3max这个游戏最高4k能玩到120帧,保守一点,选m4max应该能高特效畅玩。
m4pro我没有深入去测这游戏,因为战网客户端崩了几次,无意间看错误记录居然有调用rosetta转译,就没折腾了。
 楼主| 发表于 2025-3-10 21:03 | 显示全部楼层
terryteng 发表于 2025-3-10 16:33
马上支持mlx了 效率会提升

这几个32b模型19GB,目前能看到20% CPU/80% GPU,没有100%GPU。放一部份在CPU,对统一内存而言,是完全没必要的。
尝试手动指定GPU占用20GB,似乎没有实际生效,没有看到提升。
不过,
有一个小一点的模型是100%GPU,速度提高到16.x tokens/s。
乐观估计,
除了mlx,在内存分配上,应该也有优化空间。
 楼主| 发表于 2025-3-11 08:02 | 显示全部楼层
Jacobddu 发表于 2025-3-10 22:48
大部分现代操作系统都是把地区和时区2个选项分开的,地区是为了对某些设置做出定制或者限制,比如windows ...

在Windows的世界里,不是你选择时区,而是时区选择你,顺便还给你点惊喜——哎呀,居然忘了调时区了!但别担心,反正Windows的默认设置就像个神秘的盒子,每次都能给你带来意想不到的“惊喜”!
--以上是Chat G P T回复。

对Windows别奢望太多,对苹果系统还是可以有点追求的。
 楼主| 发表于 2025-3-11 11:33 | 显示全部楼层
VVanX1ao 发表于 2025-3-11 09:54
叠加教育优惠是不是只能北京地区京东线上购买?有人知道不转寄的话,其他地区怎么双补吗,线下可以不 ...

上海、重庆,是支持双重叠加的。还有一些地区是通过闪付,变相支持,具体可以问问JD客服。
线下,深圳有些大学里搞活动时,支持双重叠加。
 楼主| 发表于 2025-3-11 13:06 | 显示全部楼层
lqjiangzeyu 发表于 2025-3-11 11:36
我的第一反应  宝马M4什么时候出Pro了

苹果M4的“Pro”,可能还要不了同样是性能外观都在线的宝马M4…一个轮子的钱,怎么比啊
 楼主| 发表于 2025-3-11 17:40 | 显示全部楼层
VVanX1ao 发表于 2025-3-11 15:18
谢谢!想问问大学的具体情况,您指的是官网列出的这些Apple 校园体验中心吗 ...

是的。你去之前可以先打电话确认一下,有的店政策不一样也难说。目前开通的是必须是在校大学生。在校教职工以前支持,但目前双补系统现关闭了在校教职工的支持。
 楼主| 发表于 2025-3-14 10:50 | 显示全部楼层
今天补充,M4 Pro 4TB内置固态硬盘成绩。见一楼。
 楼主| 发表于 2025-3-14 12:31 | 显示全部楼层

比mac mini更mini的PC?选择不多吧。另外,9950x用液氮超频才在单核性能追上M4。如果mini PC定义是是小机器、高性能、低功耗,Mac mini应该算是。
 楼主| 发表于 2025-3-14 12:34 | 显示全部楼层
treeson 发表于 2025-3-12 09:22
最近在纠结mbp m4pro 48 512,还是m3max 48 1t,二手价格相差不大了,m3m贵个1k。追求性价比m3max很顶,40 ...

这个价位不考虑m4max 36gb 1tb?
 楼主| 发表于 2025-3-14 16:34 | 显示全部楼层
terryteng 发表于 2025-3-14 14:11
机器昨天拿到了,先上一轮跑分。
买的是M4Max + 64G + 1T,对比的是直营店里的M3Ultra + 96G,比较意外的 ...

m4max选对了!
 楼主| 发表于 2025-3-14 16:59 | 显示全部楼层
zylicheng 发表于 2025-3-14 16:52
厉害了,我mac studio m4盖 12999明天才到

这个配置与价格的确不是丐,是盖^_^,很有诱惑,方便到了也测试一下。
看看对tokens输出性能有没有影响。
 楼主| 发表于 2025-3-14 17:05 | 显示全部楼层
terryteng 发表于 2025-3-14 14:20
然后是跑大模型的结果,分别跑了qwq、gemma3:27b、deepseek-r1:32b、deepseek-r1:70b,基本是原本满配Mac ...

我用LM Studio试了一下mlx,效果不理想。然后,将ollama原来处理32b时,在m4pro 24gb占用 20%/80% cpu/gpu,调为了100% gpu之后,tokens提高了不少,从9-10 tokens/s 提升到了 16-17 tokens/s。测试数据更新在了一楼。

点评

mlx不理想是因为lm studio没能有效加载,认为模型超过内存。对于内存够的机器应该有不小提升。  发表于 2025-3-14 18:10
 楼主| 发表于 2025-3-15 07:32 | 显示全部楼层
本帖最后由 hawie 于 2025-3-15 08:57 编辑
bbzcat 发表于 2025-3-15 01:15
第一我发现很多人对于模型后面跟着的Q4_K_M只字不提
第二MAC跑推理内存带宽才是王道,在M3 Ultra的819GB/s  ...


一台机子,能跑的量化蒸馏模型不多,保留着参数,或者latest省略,都正常,除非经常换来换去。一般也就是每个模型留下最大能跑的那个。虽然我习惯拉取模型时选带具体参数的。

m3ultra 512gb很牛掰,能直接跑Q4满血R1,网测反馈速度有15.78 tokens/s (gguf)、19.17 tokens/s (mlx),是最省事的追求满血部署的高性价比成品了。
IMG_0372.png
mlx是为mac跑训练而生的,性能提升不小。

不过,入手一台机子,大都数人的生产力不在这方面。大模型只是顺带而为。量化、蒸馏损失再大,无关紧要,性能妥协而已。况且Mac studio选m3ultra也同样是一种性能妥协,这代m4没有设计ultra fusion接口(传言),所以没有m4ultra。不然,546GB/s*2的带宽,再加上m3到m4的换代性能跳跃,可想而知。

 楼主| 发表于 2025-3-15 08:45 | 显示全部楼层
zongt4 发表于 2025-3-15 08:21
显示器该换了。

这台是小朋友在用,友达7.0面板、4K160。为护眼,计划升U2725QE,又担心对付不了小朋友的FPS游戏。
 楼主| 发表于 2025-3-15 11:43 | 显示全部楼层
1楼所测AI模型,性能汇总为图表
截屏2025-03-15 11.30.50.png

已更新在1楼。
 楼主| 发表于 2025-3-15 11:55 | 显示全部楼层
dsp 发表于 2025-3-15 10:59
请问楼主多少钱拿到手的?

M4 Pro,双补¥8924入手。请朋友帮忙买的,人情最贵,未还^_^。
BTW:现在M4 Pro万兆版,JD官降了,国补价格¥9298,与双补¥8924差价很小了。
 楼主| 发表于 2025-3-15 12:02 | 显示全部楼层
M4 Pro的万兆网口,只加¥299了。苹果这价格真是……
 楼主| 发表于 2025-3-16 08:31 | 显示全部楼层
zylicheng 发表于 2025-3-14 17:01
好的,明天到了,我测试一下
但是我还算是技术小白
装deepseek,估计要折腾一下。 ...


macOS 比其他OS更容易安装deepseek:
1. 安装ollama,首页点下载、再安装即可。
  1. https://ollama.com
复制代码

2. 打开终端,运行模型。第一次运行检测到没有下载过模型,会自动下载。运行后,输入“你是谁”等任意问题,观察返回的性能。即可。
  1. ollama run hf.co/unsloth/DeepSeek-R1-Distill-Qwen-32B-GGUF:Q4_K_M --verbose
复制代码

3. Ctrl+D或/bye退出。
下载时,有可能需要科学。
 楼主| 发表于 2025-3-16 08:47 | 显示全部楼层
haoyumena 发表于 2025-3-16 08:37
请教一下100%GPU怎么设置?我现在用LM  STUDIO跑32B的,大概就是GGUF  10T/S,MLX  12T/S的样子,17的话速 ...

修改这两个参数:最低Lower bound (iogpu.wired_lwm_mb),最高Maximum limit (iogpu.wired_limit_mb)。

查看,当前设置:
  1. sudo sysctl -a | grep iogpu.wired_lwm_mb   
  2. sudo sysctl -a | grep iogpu.wired_limit_mb
复制代码

修改设置。我所用模型是19GB大小,加载后ollama ps看到是21GB,默认占用20%/80% CPU/GPU,所以修改设置GPU为19GB ~ 21GB:
  1. sudo sysctl -w iogpu.wired_limit_mb=21504
  2. sudo sysctl -w iogpu.wired_lwm_mb=19456
复制代码

单位是MB,对应19*1024、21*1024。

设置后再运行模型,用ollama ps查看变成了100% GPU。
 楼主| 发表于 2025-3-16 10:19 | 显示全部楼层
haoyumena 发表于 2025-3-16 09:50
感谢。我查看了一下我自己的,默认这两个选项已经是0,然后ollama ps显示100%GPU,我自己的是64G的版本, ...

0是默认。不是无限制。
在我24GB的机型上,用LM Studio查看默认是16GB GPU。
截屏2025-03-16 10.12.37.png
修改设置后,用LM Studio显示是21GB GPU。
截屏2025-03-16 10.10.38.png
不过,LM Studio在我这非常不稳定,刚开始能加载的,下次可能加载不了。能用的时侯,显示的tokens/s跟ollama基本一致。

你有64GB,可以用指定GPU内存大小,试试挑战一下更大的模型或更高的量化参数?
 楼主| 发表于 2025-3-16 18:46 | 显示全部楼层

好!
还有一个https://lmstudio.ai/,这个安装启动之后,它的右下角有个齿轮,点击进设置,选左侧最后一项,点击显示GPU等硬件信息。关心36GB统一内存默认会留多少给GPU。
 楼主| 发表于 2025-3-17 12:48 | 显示全部楼层
fevaoctwh 发表于 2025-3-17 10:37
LM Studio也能看,最近能跑的量化版本你参考吧

27GB VRAM,真好!跑这几个当红大模型轻轻松松了。
32b用m4 pro能及格/良好,要优秀必须得max以上了。
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-5-21 06:13 , Processed in 0.020258 second(s), 13 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表