Chiphell - 分享与交流用户体验

标题: 感谢CHH问题已解决 [打印本页]

作者: Dolfin    时间: 2023-9-11 20:34
标题: 感谢CHH问题已解决
本帖最后由 Dolfin 于 2023-12-5 10:19 编辑

感谢CHH问题已解决
作者: chacha20    时间: 2023-9-12 00:14
看起来M1的硬盘性能堪忧啊,黑苹果看起来还行

(, 下载次数: 58) (, 下载次数: 57)
作者: PPXG    时间: 2023-9-12 00:33
因为MacBook本身就是这样的存储策略,低QD爆发性能强到几乎可以默秒全,高QD就菜
作者: 赫敏    时间: 2023-9-12 04:32
本帖最后由 赫敏 于 2023-9-11 15:34 编辑

自家半吊子主控是这样的。但QD64的成绩本身就是玄学没必要看,最重要的永远是QD1T1 4k
作者: Dolfin    时间: 2023-9-12 09:34
chacha20 发表于 2023-9-12 00:14
看起来M1的硬盘性能堪忧啊,黑苹果看起来还行

很好,看了你的测试让我发现不是系统不行,是我硬件不行。。
作者: Dolfin    时间: 2023-9-12 09:40
PPXG 发表于 2023-9-12 00:33
因为MacBook本身就是这样的存储策略,低QD爆发性能强到几乎可以默秒全,高QD就菜 ...

这个存储策略的说法很有意思,是他们的有意为之吗?
作者: Dolfin    时间: 2023-9-12 09:45
赫敏 发表于 2023-9-12 04:32
自家半吊子主控是这样的。但QD64的成绩本身就是玄学没必要看,最重要的永远是QD1T1 4k ...

确实不会有什么深队列的场景,不过深队列的4k随机成绩在我测试里和windows或者其它系统间的差异巨大,甚至在同一个MACOS平台下,不同的测试软件(iozone, fio, adm, atto db)成绩也差异巨大,我都怀疑没有一个表现是真实的
作者: 赫敏    时间: 2023-9-12 09:49
Dolfin 发表于 2023-9-11 20:45
确实不会有什么深队列的场景,不过深队列的4k随机成绩在我测试里和windows或者其它系统间的差异巨大,甚 ...

不看高QD,单一个QD1 4k写苹果也够菜了。而且我觉得m1比以前Intel平台的磁盘性能还要菜
作者: 赫敏    时间: 2023-9-12 09:58
本帖最后由 赫敏 于 2023-9-11 20:59 编辑

要是pc上这种成绩出来要被喷表面固态了
(, 下载次数: 56)

作者: 赫敏    时间: 2023-9-12 10:00
PPXG 发表于 2023-9-11 11:33
因为MacBook本身就是这样的存储策略,低QD爆发性能强到几乎可以默秒全,高QD就菜 ...

问题是qd1也很菜啊,尤其是写
作者: Dolfin    时间: 2023-9-12 10:07
赫敏 发表于 2023-9-12 09:58
要是pc上这种成绩出来要被喷表面固态了

(, 下载次数: 55)

英特尔的,都很糟糕。。。
作者: fudaming    时间: 2023-9-12 10:09
本帖最后由 fudaming 于 2023-9-12 10:10 编辑

据说512的性能比1T弱,但是好像真是硬件的问题,基本只有黑苹果零头。
(, 下载次数: 54)
作者: Dolfin    时间: 2023-9-12 10:16
fudaming 发表于 2023-9-12 10:09
据说512的性能比1T弱,但是好像真是硬件的问题,基本只有黑苹果零头。

看了M2 Max,我心里平复了很多。。。
作者: PPXG    时间: 2023-9-12 10:20
Dolfin 发表于 2023-9-12 09:40
这个存储策略的说法很有意思,是他们的有意为之吗?


大概是吧,可以去看看这个
Macbook Pro storage test mbp存储测试:答辩价格,奇妙策略
作者: PPXG    时间: 2023-9-12 10:25
赫敏 发表于 2023-9-12 10:00
问题是qd1也很菜啊,尤其是写

读很强,写很菜,而且SLC缓存释放策略保守到令人发指,不知道是否有意为之
作者: hasuboy    时间: 2023-9-12 10:44
你这个确定不是脏盘了?
作者: chacha20    时间: 2023-9-12 11:14
Dolfin 发表于 2023-9-12 09:34
很好,看了你的测试让我发现不是系统不行,是我硬件不行。。

这数据看起来是主控不太行,Mac那么多swap还不多堆点硬盘性能,swap多了一不小心就缓外了。
作者: 赫敏    时间: 2023-9-12 11:17
PPXG 发表于 2023-9-11 21:25
读很强,写很菜,而且SLC缓存释放策略保守到令人发指,不知道是否有意为之 ...

写的慢为了保数据,释放慢怕写入放大。毕竟基础款8g+256g内存本身就很不够了,不悠着点写入很快就坏了
作者: Dolfin    时间: 2023-9-12 11:45
PPXG 发表于 2023-9-12 10:20
大概是吧,可以去看看这个
Macbook Pro storage test mbp存储测试:答辩价格,奇妙策略 ...


谢谢你的分享,我看了全文,有几个想法。

1.作者是怎么分别测试苹果SSD的缓内和缓外的?

2.缓内Q1T1 24万的IOPS,不到4微秒的延迟,这个数字是比P5800X还要低的,我猜测这不是SLC Cache。

3.我也使用fio 3.35做了测试,尽管机器不一样,但有一定参考性。

在缓存内,我们可以看到一个极其夸张的结果,Q1T1即达到一个夸张的数值:241k iops,这个数字什么概念,PC801在ubuntu下测出Q1T1只有21k,这已经是12倍甚至11倍的差距了,这已经不是一般的固态了,一定要出重拳!


这个数字要比我高了十倍有余,但当我在fio命令中,--direct=1 改成0,允许页面缓存之后,我达到了类似的IOPS和延迟,所以我进一步猜测它测的不是SSD。

(, 下载次数: 55)
4k随机,Q1T1,IOPS 12000, 延迟80微秒,吞吐 50.9MB/s
这是绕开页面缓存直接在SSD IO的结果。

(, 下载次数: 55)
4k随机 Q1T1, IOPS 平均12万,最高24万,延迟7微秒,吞吐 516MB/s
这是打开页面缓存的结果
作者: chacha20    时间: 2023-9-12 12:59
本帖最后由 chacha20 于 2023-9-12 13:33 编辑
Dolfin 发表于 2023-9-12 11:45
谢谢你的分享,我看了全文,有几个想法。

1.作者是怎么分别测试苹果SSD的缓内和缓外的?


我也觉得这个SLC cache能提升10倍实在是不现实,应该是搞在内存缓存里了


980pro这种旗舰盘SLC缓存对读取的提升都不到2倍,而且SLC读对于加载速度帮助不是很大,缓外读取才是更重要的,毕竟SLC缓存都会释放。


辣鸡黑苹果开关directio没区别

(, 下载次数: 57)
作者: Dolfin    时间: 2023-9-12 14:45
chacha20 发表于 2023-9-12 12:59
我也觉得这个SLC cache能提升10倍实在是不现实,应该是搞在内存缓存里了

嗯,我也认为是内存,Q1T1 4k随机读 674MB/s ,一个惊人的数字
作者: ekiuc    时间: 2023-9-12 15:16
AmorphousDiskMark我跑万兆SMB的顺序写速度是BMD那个磁盘测试的1/10,不知道是哪里出了岔子……
作者: fudaming    时间: 2023-9-12 15:29
directIO 关
(, 下载次数: 48)


directIO 开
(, 下载次数: 51)
作者: Dolfin    时间: 2023-9-12 16:56
fudaming 发表于 2023-9-12 15:29
directIO 关

换成psync这个同步io引擎的用意是什么?
作者: Phil_Libra    时间: 2023-9-12 17:00
chacha20 发表于 2023-9-12 00:14
看起来M1的硬盘性能堪忧啊,黑苹果看起来还行

我艹这个4k写真nb,看了下sz1735也就200不到
作者: fudaming    时间: 2023-9-12 17:22
本帖最后由 fudaming 于 2023-9-12 17:33 编辑
Dolfin 发表于 2023-9-12 16:56
换成psync这个同步io引擎的用意是什么?


我的macOS好像没有libaio,manpage说psync是默认的。

(, 下载次数: 48)
作者: Dolfin    时间: 2023-9-12 17:41
fudaming 发表于 2023-9-12 17:22
我的macOS好像没有libaio,manpage说psync是默认的。

异步io引擎可以可以用posixaio
作者: fudaming    时间: 2023-9-12 19:01
Dolfin 发表于 2023-9-12 17:41
异步io引擎可以可以用posixaio

正在看结果。

direct io off

  1. job2: (g=0): rw=randwrite, bs=(R) 512B-512B, (W) 512B-512B, (T) 512B-512B, ioengine=posixaio, iodepth=64
  2. fio-3.35
  3. Starting 2 processes

  4. job1: (groupid=0, jobs=1): err= 0: pid=27978: Tue Sep 12 17:32:14 2023
  5.   write: IOPS=54.4k, BW=212MiB/s (223MB/s)(1024MiB/4822msec); 0 zone resets
  6.     slat (nsec): min=0, max=479000, avg=391.30, stdev=1633.04
  7.     clat (usec): min=6, max=173373, avg=292.62, stdev=1141.94
  8.      lat (usec): min=7, max=173373, avg=293.02, stdev=1141.93
  9.     clat percentiles (usec):
  10.      |  1.00th=[   40],  5.00th=[   53], 10.00th=[   58], 20.00th=[   68],
  11.      | 30.00th=[  102], 40.00th=[  151], 50.00th=[  198], 60.00th=[  265],
  12.      | 70.00th=[  355], 80.00th=[  469], 90.00th=[  635], 95.00th=[  766],
  13.      | 99.00th=[  988], 99.50th=[ 1106], 99.90th=[ 1745], 99.95th=[ 2057],
  14.      | 99.99th=[68682]
  15.    bw (  KiB/s): min=73804, max=426796, per=92.97%, avg=194218.33, stdev=122151.20, samples=9
  16.    iops        : min=18451, max=106699, avg=48554.44, stdev=30537.87, samples=9
  17.   lat (usec)   : 10=0.04%, 20=0.20%, 50=2.59%, 100=26.59%, 250=28.28%
  18.   lat (usec)   : 500=24.38%, 750=12.34%, 1000=4.65%
  19.   lat (msec)   : 2=0.86%, 4=0.04%, 10=0.01%, 20=0.01%, 50=0.01%
  20.   lat (msec)   : 100=0.01%, 250=0.01%
  21.   cpu          : usr=9.83%, sys=8.79%, ctx=111335, majf=0, minf=6
  22.   IO depths    : 1=0.1%, 2=0.1%, 4=0.5%, 8=50.9%, 16=48.5%, 32=0.0%, >=64=0.0%
  23.      submit    : 0=0.0%, 4=100.0%, 8=0.0%, 16=0.0%, 32=0.0%, 64=0.0%, >=64=0.0%
  24.      complete  : 0=0.0%, 4=98.8%, 8=1.1%, 16=0.1%, 32=0.0%, 64=0.0%, >=64=0.0%
  25.      issued rwts: total=0,262144,0,0 short=0,0,0,0 dropped=0,0,0,0
  26.      latency   : target=0, window=0, percentile=100.00%, depth=64
  27. job2: (groupid=0, jobs=1): err= 0: pid=27979: Tue Sep 12 17:32:14 2023
  28.   write: IOPS=209k, BW=102MiB/s (107MB/s)(1024MiB/10039msec); 0 zone resets
  29.     slat (nsec): min=0, max=167000, avg=1750.70, stdev=2200.53
  30.     clat (usec): min=5, max=20115, avg=62.46, stdev=124.83
  31.      lat (usec): min=6, max=20115, avg=64.21, stdev=124.44
  32.     clat percentiles (usec):
  33.      |  1.00th=[    8],  5.00th=[   11], 10.00th=[   15], 20.00th=[   20],
  34.      | 30.00th=[   23], 40.00th=[   28], 50.00th=[   32], 60.00th=[   38],
  35.      | 70.00th=[   43], 80.00th=[   49], 90.00th=[   86], 95.00th=[  277],
  36.      | 99.00th=[  685], 99.50th=[  799], 99.90th=[ 1029], 99.95th=[ 1172],
  37.      | 99.99th=[ 1827]
  38.    bw (  KiB/s): min= 9227, max=199510, per=48.72%, avg=101785.95, stdev=75985.57, samples=19
  39.    iops        : min=18455, max=399021, avg=203572.26, stdev=151971.18, samples=19
  40.   lat (usec)   : 10=3.90%, 20=17.74%, 50=58.73%, 100=10.28%, 250=3.91%
  41.   lat (usec)   : 500=3.18%, 750=1.57%, 1000=0.58%
  42.   lat (msec)   : 2=0.11%, 4=0.01%, 10=0.01%, 20=0.01%, 50=0.01%
  43.   cpu          : usr=19.18%, sys=27.45%, ctx=596600, majf=0, minf=7
  44.   IO depths    : 1=1.1%, 2=6.7%, 4=17.8%, 8=58.3%, 16=16.0%, 32=0.0%, >=64=0.0%
  45.      submit    : 0=0.0%, 4=100.0%, 8=0.0%, 16=0.0%, 32=0.0%, 64=0.0%, >=64=0.0%
  46.      complete  : 0=0.0%, 4=95.1%, 8=1.1%, 16=3.8%, 32=0.0%, 64=0.0%, >=64=0.0%
  47.      issued rwts: total=0,2097152,0,0 short=0,0,0,0 dropped=0,0,0,0
  48.      latency   : target=0, window=0, percentile=100.00%, depth=64

  49. Run status group 0 (all jobs):
  50.   WRITE: bw=204MiB/s (214MB/s), 102MiB/s-212MiB/s (107MB/s-223MB/s), io=2048MiB (2147MB), run=4822-10039msec
复制代码


direct io on

  1. job2: (g=0): rw=randwrite, bs=(R) 512B-512B, (W) 512B-512B, (T) 512B-512B, ioengine=posixaio, iodepth=64
  2. fio-3.35
  3. Starting 2 processes

  4. job1: (groupid=0, jobs=1): err= 0: pid=28272: Tue Sep 12 19:00:06 2023
  5.   write: IOPS=14.9k, BW=58.1MiB/s (60.9MB/s)(1024MiB/17634msec); 0 zone resets
  6.     slat (nsec): min=0, max=114000, avg=1132.41, stdev=1641.45
  7.     clat (usec): min=55, max=7592, avg=1072.92, stdev=551.45
  8.      lat (usec): min=62, max=7593, avg=1074.05, stdev=551.31
  9.     clat percentiles (usec):
  10.      |  1.00th=[  237],  5.00th=[  404], 10.00th=[  523], 20.00th=[  652],
  11.      | 30.00th=[  725], 40.00th=[  783], 50.00th=[  848], 60.00th=[ 1012],
  12.      | 70.00th=[ 1319], 80.00th=[ 1647], 90.00th=[ 1926], 95.00th=[ 2073],
  13.      | 99.00th=[ 2343], 99.50th=[ 2474], 99.90th=[ 2999], 99.95th=[ 4359],
  14.      | 99.99th=[ 6980]
  15.    bw (  KiB/s): min=50539, max=130415, per=100.00%, avg=59508.57, stdev=15044.74, samples=35
  16.    iops        : min=12634, max=32603, avg=14876.86, stdev=3761.10, samples=35
  17.   lat (usec)   : 100=0.01%, 250=1.23%, 500=7.75%, 750=25.10%, 1000=25.29%
  18.   lat (msec)   : 2=33.55%, 4=7.01%, 10=0.06%
  19.   cpu          : usr=6.49%, sys=9.47%, ctx=190435, majf=0, minf=6
  20.   IO depths    : 1=0.1%, 2=0.1%, 4=0.1%, 8=46.0%, 16=54.0%, 32=0.0%, >=64=0.0%
  21.      submit    : 0=0.0%, 4=100.0%, 8=0.0%, 16=0.0%, 32=0.0%, 64=0.0%, >=64=0.0%
  22.      complete  : 0=0.0%, 4=99.0%, 8=1.0%, 16=0.1%, 32=0.0%, 64=0.0%, >=64=0.0%
  23.      issued rwts: total=0,262144,0,0 short=0,0,0,0 dropped=0,0,0,0
  24.      latency   : target=0, window=0, percentile=100.00%, depth=64
  25. job2: (groupid=0, jobs=1): err= 0: pid=28273: Tue Sep 12 19:00:06 2023
  26.   write: IOPS=16.9k, BW=8466KiB/s (8669kB/s)(1024MiB/123857msec); 0 zone resets
  27.     slat (nsec): min=0, max=703000, avg=595.05, stdev=1112.55
  28.     clat (usec): min=26, max=14149, avg=943.03, stdev=927.02
  29.      lat (usec): min=29, max=14151, avg=943.62, stdev=927.04
  30.     clat percentiles (usec):
  31.      |  1.00th=[  314],  5.00th=[  375], 10.00th=[  404], 20.00th=[  437],
  32.      | 30.00th=[  465], 40.00th=[  486], 50.00th=[  510], 60.00th=[  537],
  33.      | 70.00th=[  685], 80.00th=[ 1549], 90.00th=[ 2311], 95.00th=[ 3163],
  34.      | 99.00th=[ 3392], 99.50th=[ 4228], 99.90th=[ 6980], 99.95th=[ 8455],
  35.      | 99.99th=[11338]
  36.    bw (  KiB/s): min= 2022, max=16247, per=50.05%, avg=8474.73, stdev=1586.48, samples=246
  37.    iops        : min= 4045, max=32495, avg=16949.91, stdev=3172.99, samples=246
  38.   lat (usec)   : 50=0.01%, 100=0.01%, 250=0.25%, 500=46.33%, 750=25.47%
  39.   lat (usec)   : 1000=4.04%
  40.   lat (msec)   : 2=12.83%, 4=10.51%, 10=0.54%, 20=0.02%
  41.   cpu          : usr=6.07%, sys=7.14%, ctx=1779154, majf=0, minf=7
  42.   IO depths    : 1=0.1%, 2=0.1%, 4=0.1%, 8=45.2%, 16=54.8%, 32=0.0%, >=64=0.0%
  43.      submit    : 0=0.0%, 4=100.0%, 8=0.0%, 16=0.0%, 32=0.0%, 64=0.0%, >=64=0.0%
  44.      complete  : 0=0.0%, 4=99.0%, 8=1.0%, 16=0.1%, 32=0.0%, 64=0.0%, >=64=0.0%
  45.      issued rwts: total=0,2097152,0,0 short=0,0,0,0 dropped=0,0,0,0
  46.      latency   : target=0, window=0, percentile=100.00%, depth=64

  47. Run status group 0 (all jobs):
  48.   WRITE: bw=16.5MiB/s (17.3MB/s), 8466KiB/s-58.1MiB/s (8669kB/s-60.9MB/s), io=2048MiB (2147MB), run=17634-123857msec
复制代码

作者: chacha20    时间: 2023-9-12 19:15
Phil_Libra 发表于 2023-9-12 17:00
我艹这个4k写真nb,看了下sz1735也就200不到

这个测试项目和Windows没有可比性,似乎差别很大,win下4k写也是200多,不过买sz1735可真有钱。。。
作者: Phil_Libra    时间: 2023-9-12 19:18
本帖最后由 Phil_Libra 于 2023-9-12 20:50 编辑
chacha20 发表于 2023-9-12 19:15
这个测试项目和Windows没有可比性,似乎差别很大,win下4k写也是200多,不过买sz1735可真有钱。。。 ...


800G也不贵吧,也算是个收藏了,估计也没下一代了。现在就差FL6或者大普微同芯片那个没有买了。
作者: chacha20    时间: 2023-9-12 20:26
Phil_Libra 发表于 2023-9-12 19:18
800G也不贵吧,也算是个收藏了,估计也没下一代了。现在就差FL6或者大普微同芯片那么没有了。 ...

有道理,说的我都想买了
作者: bbzcat    时间: 2023-9-21 10:14
话说256G的Air固态天生残疾你是不知道么...
作者: kuram    时间: 2023-9-21 10:19
本来就是这样啊 而且还要考虑这垃圾硬盘 使用一段时间的自己损耗降低速度!!
作者: Dolfin    时间: 2023-9-21 10:49
bbzcat 发表于 2023-9-21 10:14
话说256G的Air固态天生残疾你是不知道么...

你看帖看出来这是256G的事吗?
作者: wangzorro    时间: 2023-9-21 10:54
没接触过这个测试软件,是不是跑在兼容模式下的呀
作者: bbzcat    时间: 2023-9-21 11:28
本帖最后由 bbzcat 于 2023-9-21 11:30 编辑
Dolfin 发表于 2023-9-21 10:49
你看帖看出来这是256G的事吗?


第一张图最下面有型号,你看不见?

不对呀这不是你发的贴么?
作者: Dolfin    时间: 2023-9-21 11:35
bbzcat 发表于 2023-9-21 10:14
话说256G的Air固态天生残疾你是不知道么...

睁开眼睛看的见下面的Ap512r,Ap1024n,Ap0512z吗?觉得就你知道,其他回帖的都不知道?那么多数字你看见了吗,想当然。
作者: 23319858    时间: 2023-9-22 05:36
有这么差吗?我记得我的m1 pro有5000多阿!
作者: Ownab    时间: 2023-9-27 09:44
你不说我都不知道 我的2T容量的  4KQD1测了下也这么差 , 当时为了大容量性能高才加钱上的, 测了下只有1M那些有差距, 4K官方只字未提,  看来智商税了
作者: Ownab    时间: 2023-9-27 09:46
chacha20 发表于 2023-9-12 00:14
看起来M1的硬盘性能堪忧啊,黑苹果看起来还行

虽然性能差, 但是温度低啊(我只能这么安慰自己了 哈哈哈哈哈 )

(, 下载次数: 28)
作者: chacha20    时间: 2023-9-27 10:40
Ownab 发表于 2023-9-27 09:46
虽然性能差, 但是温度低啊(我只能这么安慰自己了 哈哈哈哈哈 )

确实,pcie4主控热的一批,不加散热片分分钟60度,PC801待机都45度




欢迎光临 Chiphell - 分享与交流用户体验 (https://www.chiphell.com/) Powered by Discuz! X3.5