跨越不止一点——M4升级M4 Pro+4TB/32B至每秒17词

hawie · 发表于 2025-3-9 10:03

本帖最后由 hawie 于 2025-3-15 12:16 编辑

目录

一、前言
二、Apple Silicon第四代：M4、M4 Pro、M4 Max规格对比
三、前所未有的国补和教育双重优惠
四、双选开箱：M4万兆版 vs M4 Pro万兆版
五、跨越四代的性能测试：M1、M2、M4、M4 Pro
六、结语

一、前言

自2020年Apple Silicon横空出世以来，M系列芯片以颠覆性的性能与能效比重塑了个人计算设备的边界。从M1到M4的迭代，苹果不断刷新行业标杆。而第四代Apple Silicon——M4、M4 Pro、M4 Max——以更激进的单核性能提升，通过iPad Pro、Mac mini、MacBook Air/Pro和Mac Studio等精准定位的产品全方位登场。

同时，因为有了国家的宏观促进消费政策，我们某天猛然发现，苹果居然也有了性价比。

如果说M4是苹果对当今性能普惠的承诺，那么M4 Pro、M4 Max则是为专业追求用户的量身定制。以下从技术对比、优惠政策、开箱及性能测试多维度，结合Mac mini历代产品的体验，分享从M4升级到M4 Pro的跨越式价值。

二、Apple Silicon第四代：M4、M4 Pro、M4 Max规格对比

1. 核心数量：
M4 采用 10 核 CPU（4 性能 + 6 效率），最高 10 核心 GPU。
M4 Pro 采用 12 核 CPU（8 性能 + 4 效率）、16 核 GPU，或者 14 核 CPU（10 性能 + 4 效率）、20 核 GPU。
M4 Max 采用 14 核 CPU（10 性能 + 4 效率）、32 核 GPU，或者 16 核 CPU（12 性能 + 4 效率）、40 核 GPU。
均采用 16 核心 NPU。
2. 内存带宽与最大支持容量：
M4：120GB/s，最高支持 32GB 统一内存。
M4 Pro：273GB/s，最高支持 64GB 统一内存。
M4 Max：410GB/s（14核CPU）或 546GB/s（16核CPU），最高支持 128GB 统一内存。
3. 重要参数图表：

三、前所未有的国补和教育双重优惠

以下根据京东自营的国补、教育双重优惠之后的价格，分别按照M4、M4 Pro、M4 Max的典型Mac mini配置、Mac Studio配置，列出当前最新优惠。
1. 价格优惠表：
截屏2025-03-08 22.53.47.png

2. 优惠折扣图（制作的英文版, 中文有乱码，下同）：
截屏2025-03-08 22.57.20.png

其中，M4、M4 Pro为Mac mini机型，M4 Max为Mac Studio机型的基础版。

四、双选开箱：M4万兆版 vs M4 Pro万兆版

因为有了国补优惠，相比前一代，入手哪一款都觉得性价比很高。
个人而言，有连接万兆内网NAS的需要，万兆是刚需，所以，选择了最基础的M4加万兆的配置入手。
使用三个月后，改为重新入手M4 Pro基础款加万兆的配置。
这两款，只有快递牛皮纸外包装（M4 Pro的可重复使用看似改进设计了）、及盒中最底层里面的纸片有M4、M4 Pro印刷的区别，其他没有任何外观上的区别。
以下简约开箱：
1. 外包装，Pro版可重复使用：
包装大小跟一个电脑音箱差不多。
M4 Pro，
外包装1.JPEG

M4，

2. 内包装，机身：
机身设计大改，延续 Apple一贯的极简风格。

3. 桌面，外观小巧精致：
跟旁边的D41机箱比起来，不，真是小到没法比。宽度跟iPad mini 7差不多（小0.8cm），高度是iPad mini 7的四分之一。

4. 系统安装，从时间机器恢复：
安装过程一如既往，没有什么特殊的，就不表了。过程中，发现苹果安装时的一个小BUG，如图，右上角的时间显示是错误的。既不是东8区的时间，也不是UTC时间，显示的是东8区的时间再加8个小时的时间，有意思。

五、跨越四代的性能测试：M1、M2、M4、M4 Pro

惯例安装系统时，选择了从时间机器恢复，时间机器保存了从M1开始的Mac mini以来历代数据，包含测试应用。正好方便以相同的测试工具，对不同代的机器性能进行评估。

1. Geekbench 5，CPU：
其中链接指向的，是我名下提交给Geekbench的成绩。下同。

2. Geekbench 6，CPU：

可以看出，M4 和 M4 Pro 在 GeekBench 6 的单核和多核表现均大幅领先于 M2，特别是 M4 Pro 的多核性能接近 M2 的 2.15 倍。

3. Geekbench 5，GPU：

可以看出，Apple M4 Pro 在 GPU 计算性能上大幅领先，尤其是使用 Metal API 时的得分最高。

4. Geekbench 6，GPU：

可以看到，Apple M4 Pro 在 Metal API 下的 GPU 计算性能提升明显，达到 94,269 分，远超 M4 和 M2。

5. Geekbench AI：

可以看到，Apple M4 Pro 在 Neural Engine 上的 AI 计算性能远超其他芯片，总分达 48,375，训练性能尤为突出。

6. 相同AI模型下的性能：
M4:

M4 Pro：

7. M4 Pro, 其他AI模型性能：
DeepSeek-R1 32b,
截屏2025-03-05 14.10.31.png

Qwen2.5-Coder 32B，
截屏2025-03-07 09.39.38.png

QwQ-32B，

2025.03.14.+ 将32b模型优化为100% GPU占用，性能提升至17 tokens/s：
DeepSeek-R1 32b,
截屏2025-03-14 15.57.57.png

Qwen2.5-Coder 32B，
截屏2025-03-14 16.24.14.png

QwQ-32B，

此时GPU功耗约为25W，CPU功耗约为1W：
截屏2025-03-14 16.00.42.png

8. AI模型性能图表，2025.03.15.+ AI模型性能汇总：
截屏2025-03-15 11.30.31.png

9. 固态硬盘性能：
M4 Pro，
512GB,
截屏2025-03-05 10.23.00.png

4TB, 2025.03.14.+ 采用的内置小板替换方式，不破坏原盘，应该不影响苹果质保。系统识别为苹果的官方型号APPLE SSD AP4096Z，使用上与原盘一致。这个M4 Pro版的4TB内置小板，选的是天极团队、小天才李燎 Pro产品，因为最先他做出来的M4版用下来很稳定、速度也更快。首测成绩，写速超过10000 MB/s，这接口是PCIe 5.0了吗：
截屏2025-03-14 10.58.27.png

M4:
256GB，

2TB，

10. 游戏性能：
除了原生macOS/iOS游戏，官方及第三方也有了工具，运行Windows游戏。
这里仅用原生的古墓丽影自带Benchmark，测试M4 Pro在4K分辨率下的帧率，作为参考。
截屏2025-03-09 03.58.19.png

六、结语

M4 系列的推出，标志着 Apple Silicon 的新一轮进化。
M4 Pro相比M4，在日常使用之余，可以兼顾如今热门的AI大模型本地部署。得益于24GB以上的统一内存，32b输出能达到 17 tokens/s，而32billion参数也正好是很多大模型实用的门槛。
这样一款高性能、低功耗、还有了性价比的设备，无论是工作、娱乐、AI，都是值得考虑的不可多得的利器。
M4 Pro，跨越不止一点。

hawie · 发表于 2025-3-9 17:18

本帖最后由 hawie 于 2025-3-9 17:28 编辑

cyuet 发表于 2025-3-9 16:15
本来还准备把M1Max的 Studio换成M4Pro, 现在看来AI的水平起是还打不过M1Max的丐版

total duration: ...

m1max是400GB/s 内存带宽吧，m4pro是273GB/s。其实新出的Mac studio不错，你升级路线改为M4Max自然会全面胜出。mac studio要是早几天推出来，我应该也会选择m4max。

hawie · 发表于 2025-3-10 10:48

terryteng 发表于 2025-3-10 08:55
2月底购入了一批Mac mini M4Pro+64G+2T，上周赶紧退了，换Mac Studio M4Max+64G+1T，贵1k ...

那是非常不错。方便同样跑一个上面的32B的模型，看看速度提高多少？

hawie · 发表于 2025-3-10 20:21

MilkyWayne 发表于 2025-3-10 15:31
能否再评价下散热？

担心这一代的壳是给M4设计的，M4Pro会吃力......

满载在表面感觉不到有什么温度，依然是游刃有余。不知道满血版会不会有压力。

hawie · 发表于 2025-3-10 20:26

Jacobddu 发表于 2025-3-10 15:36
默认的时区是Pacific Time UTC -8，哪里是bug了？

真要细细体验，也可以算是bug了，因为这个时侯发生在，更新系统及恢复时间机器数据。而在这之前的安装步骤，首当其冲就已经选择过“中国大陆”了，以苹果的水准，应该调整为对应的时区。

hawie · 发表于 2025-3-10 20:42

多蒙发表于 2025-3-10 15:45
好靓且专业的评测。
另请教楼主，目前我就玩一个魔兽世界，主机配的是4070ti显卡，感觉还是太大了。
最近想 ...

魔兽世界在macOS有原生支持。听说m3max这个游戏最高4k能玩到120帧，保守一点，选m4max应该能高特效畅玩。
m4pro我没有深入去测这游戏，因为战网客户端崩了几次，无意间看错误记录居然有调用rosetta转译，就没折腾了。

hawie · 发表于 2025-3-10 21:03

terryteng 发表于 2025-3-10 16:33
马上支持mlx了效率会提升

这几个32b模型19GB，目前能看到20% CPU/80% GPU，没有100%GPU。放一部份在CPU，对统一内存而言，是完全没必要的。
尝试手动指定GPU占用20GB，似乎没有实际生效，没有看到提升。
不过，
有一个小一点的模型是100%GPU，速度提高到16.x tokens/s。
乐观估计，
除了mlx，在内存分配上，应该也有优化空间。

hawie · 发表于 2025-3-11 08:02

Jacobddu 发表于 2025-3-10 22:48
大部分现代操作系统都是把地区和时区2个选项分开的，地区是为了对某些设置做出定制或者限制，比如windows ...

在Windows的世界里，不是你选择时区，而是时区选择你，顺便还给你点惊喜——哎呀，居然忘了调时区了！但别担心，反正Windows的默认设置就像个神秘的盒子，每次都能给你带来意想不到的“惊喜”！
--以上是Chat G P T回复。

对Windows别奢望太多，对苹果系统还是可以有点追求的。

hawie · 发表于 2025-3-11 11:33

VVanX1ao 发表于 2025-3-11 09:54
叠加教育优惠是不是只能北京地区京东线上购买？有人知道不转寄的话，其他地区怎么双补吗，线下可以不 ...

上海、重庆，是支持双重叠加的。还有一些地区是通过闪付，变相支持，具体可以问问JD客服。
线下，深圳有些大学里搞活动时，支持双重叠加。

hawie · 发表于 2025-3-11 13:06

lqjiangzeyu 发表于 2025-3-11 11:36
我的第一反应宝马M4什么时候出Pro了

苹果M4的“Pro”，可能还要不了同样是性能外观都在线的宝马M4…一个轮子的钱，怎么比啊

hawie · 发表于 2025-3-11 17:40

VVanX1ao 发表于 2025-3-11 15:18
谢谢！想问问大学的具体情况，您指的是官网列出的这些Apple 校园体验中心吗 ...

是的。你去之前可以先打电话确认一下，有的店政策不一样也难说。目前开通的是必须是在校大学生。在校教职工以前支持，但目前双补系统现关闭了在校教职工的支持。

hawie · 发表于 2025-3-14 10:50

今天补充，M4 Pro 4TB内置固态硬盘成绩。见一楼。

hawie · 发表于 2025-3-14 12:31

xyang01 发表于 2025-3-13 09:41
可以当mini PC?

比mac mini更mini的PC？选择不多吧。另外，9950x用液氮超频才在单核性能追上M4。如果mini PC定义是是小机器、高性能、低功耗，Mac mini应该算是。

hawie · 发表于 2025-3-14 12:34

treeson 发表于 2025-3-12 09:22
最近在纠结mbp m4pro 48 512，还是m3max 48 1t，二手价格相差不大了，m3m贵个1k。追求性价比m3max很顶，40 ...

这个价位不考虑m4max 36gb 1tb？

hawie · 发表于 2025-3-14 16:34

terryteng 发表于 2025-3-14 14:11
机器昨天拿到了，先上一轮跑分。
买的是M4Max + 64G + 1T，对比的是直营店里的M3Ultra + 96G，比较意外的 ...

m4max选对了！

hawie · 发表于 2025-3-14 16:59

zylicheng 发表于 2025-3-14 16:52
厉害了，我mac studio m4盖 12999明天才到

这个配置与价格的确不是丐，是盖^_^，很有诱惑，方便到了也测试一下。
看看对tokens输出性能有没有影响。

hawie · 发表于 2025-3-14 17:05

terryteng 发表于 2025-3-14 14:20
然后是跑大模型的结果，分别跑了qwq、gemma3:27b、deepseek-r1:32b、deepseek-r1:70b，基本是原本满配Mac ...

我用LM Studio试了一下mlx，效果不理想。然后，将ollama原来处理32b时，在m4pro 24gb占用 20%/80% cpu/gpu，调为了100% gpu之后，tokens提高了不少，从9-10 tokens/s 提升到了 16-17 tokens/s。测试数据更新在了一楼。

hawie · 发表于 2025-3-15 07:32

本帖最后由 hawie 于 2025-3-15 08:57 编辑

bbzcat 发表于 2025-3-15 01:15
第一我发现很多人对于模型后面跟着的Q4_K_M只字不提
第二MAC跑推理内存带宽才是王道，在M3 Ultra的819GB/s ...

一台机子，能跑的量化蒸馏模型不多，保留着参数，或者latest省略，都正常，除非经常换来换去。一般也就是每个模型留下最大能跑的那个。虽然我习惯拉取模型时选带具体参数的。

m3ultra 512gb很牛掰，能直接跑Q4满血R1，网测反馈速度有15.78 tokens/s （gguf）、19.17 tokens/s （mlx），是最省事的追求满血部署的高性价比成品了。

mlx是为mac跑训练而生的，性能提升不小。

不过，入手一台机子，大都数人的生产力不在这方面。大模型只是顺带而为。量化、蒸馏损失再大，无关紧要，性能妥协而已。况且Mac studio选m3ultra也同样是一种性能妥协，这代m4没有设计ultra fusion接口（传言），所以没有m4ultra。不然，546GB/s*2的带宽，再加上m3到m4的换代性能跳跃，可想而知。

hawie · 发表于 2025-3-15 08:45

zongt4 发表于 2025-3-15 08:21
显示器该换了。

这台是小朋友在用，友达7.0面板、4K160。为护眼，计划升U2725QE，又担心对付不了小朋友的FPS游戏。

hawie · 发表于 2025-3-15 11:43

1楼所测AI模型，性能汇总为图表
截屏2025-03-15 11.30.50.png

已更新在1楼。

hawie · 发表于 2025-3-15 11:55

dsp 发表于 2025-3-15 10:59
请问楼主多少钱拿到手的？

M4 Pro，双补¥8924入手。请朋友帮忙买的，人情最贵，未还^_^。
BTW：现在M4 Pro万兆版，JD官降了，国补价格¥9298，与双补¥8924差价很小了。

hawie · 发表于 2025-3-15 12:02

M4 Pro的万兆网口，只加¥299了。苹果这价格真是……

hawie · 发表于 2025-3-16 08:31

zylicheng 发表于 2025-3-14 17:01
好的，明天到了，我测试一下
但是我还算是技术小白
装deepseek，估计要折腾一下。 ...

macOS 比其他OS更容易安装deepseek：
1. 安装ollama，首页点下载、再安装即可。

https://ollama.com

复制代码

2. 打开终端，运行模型。第一次运行检测到没有下载过模型，会自动下载。运行后，输入“你是谁”等任意问题，观察返回的性能。即可。

ollama run hf.co/unsloth/DeepSeek-R1-Distill-Qwen-32B-GGUF:Q4_K_M --verbose

复制代码

3. Ctrl+D或/bye退出。
下载时，有可能需要科学。

hawie · 发表于 2025-3-16 08:47

haoyumena 发表于 2025-3-16 08:37
请教一下100%GPU怎么设置?我现在用LM STUDIO跑32B的，大概就是GGUF 10T/S，MLX 12T/S的样子，17的话速 ...

修改这两个参数：最低Lower bound (iogpu.wired_lwm_mb)，最高Maximum limit (iogpu.wired_limit_mb)。

查看，当前设置：

sudo sysctl -a | grep iogpu.wired_lwm_mb
sudo sysctl -a | grep iogpu.wired_limit_mb

复制代码

修改设置。我所用模型是19GB大小，加载后ollama ps看到是21GB，默认占用20%/80% CPU/GPU，所以修改设置GPU为19GB ～ 21GB：

sudo sysctl -w iogpu.wired_limit_mb=21504
sudo sysctl -w iogpu.wired_lwm_mb=19456

复制代码

单位是MB，对应19*1024、21*1024。

设置后再运行模型，用ollama ps查看变成了100% GPU。

hawie · 发表于 2025-3-16 10:19

haoyumena 发表于 2025-3-16 09:50
感谢。我查看了一下我自己的，默认这两个选项已经是0，然后ollama ps显示100%GPU，我自己的是64G的版本， ...

0是默认。不是无限制。
在我24GB的机型上，用LM Studio查看默认是16GB GPU。
截屏2025-03-16 10.12.37.png

修改设置后，用LM Studio显示是21GB GPU。
截屏2025-03-16 10.10.38.png

不过，LM Studio在我这非常不稳定，刚开始能加载的，下次可能加载不了。能用的时侯，显示的tokens/s跟ollama基本一致。

你有64GB，可以用指定GPU内存大小，试试挑战一下更大的模型或更高的量化参数？

hawie · 发表于 2025-3-16 18:46

zylicheng 发表于 2025-3-16 16:57
已经收到了

好！
还有一个https://lmstudio.ai/，这个安装启动之后，它的右下角有个齿轮，点击进设置，选左侧最后一项，点击显示GPU等硬件信息。关心36GB统一内存默认会留多少给GPU。

hawie · 发表于 2025-3-17 12:48

fevaoctwh 发表于 2025-3-17 10:37
LM Studio也能看，最近能跑的量化版本你参考吧

27GB VRAM，真好！跑这几个当红大模型轻轻松松了。
32b用m4 pro能及格/良好，要优秀必须得max以上了。

账号		自动登录	找回密码
密码			加入我们

[电脑] 跨越不止一点——M4升级M4 Pro+4TB/32B至每秒17词

评分

点评

浏览过的版块