Dolfin 发表于 2023-9-11 20:34

感谢CHH问题已解决

本帖最后由 Dolfin 于 2023-12-5 10:19 编辑

感谢CHH问题已解决

chacha20 发表于 2023-9-12 00:14

看起来M1的硬盘性能堪忧啊,黑苹果看起来还行

PPXG 发表于 2023-9-12 00:33

因为MacBook本身就是这样的存储策略,低QD爆发性能强到几乎可以默秒全,高QD就菜

赫敏 发表于 2023-9-12 04:32

本帖最后由 赫敏 于 2023-9-11 15:34 编辑

自家半吊子主控是这样的。但QD64的成绩本身就是玄学没必要看,最重要的永远是QD1T1 4k

Dolfin 发表于 2023-9-12 09:34

chacha20 发表于 2023-9-12 00:14
看起来M1的硬盘性能堪忧啊,黑苹果看起来还行

很好,看了你的测试让我发现不是系统不行,是我硬件不行。。

Dolfin 发表于 2023-9-12 09:40

PPXG 发表于 2023-9-12 00:33
因为MacBook本身就是这样的存储策略,低QD爆发性能强到几乎可以默秒全,高QD就菜 ...

这个存储策略的说法很有意思,是他们的有意为之吗?

Dolfin 发表于 2023-9-12 09:45

赫敏 发表于 2023-9-12 04:32
自家半吊子主控是这样的。但QD64的成绩本身就是玄学没必要看,最重要的永远是QD1T1 4k ...

确实不会有什么深队列的场景,不过深队列的4k随机成绩在我测试里和windows或者其它系统间的差异巨大,甚至在同一个MACOS平台下,不同的测试软件(iozone, fio, adm, atto db)成绩也差异巨大,我都怀疑没有一个表现是真实的

赫敏 发表于 2023-9-12 09:49

Dolfin 发表于 2023-9-11 20:45
确实不会有什么深队列的场景,不过深队列的4k随机成绩在我测试里和windows或者其它系统间的差异巨大,甚 ...

不看高QD,单一个QD1 4k写苹果也够菜了。而且我觉得m1比以前Intel平台的磁盘性能还要菜

赫敏 发表于 2023-9-12 09:58

本帖最后由 赫敏 于 2023-9-11 20:59 编辑

要是pc上这种成绩出来要被喷表面固态了

赫敏 发表于 2023-9-12 10:00

PPXG 发表于 2023-9-11 11:33
因为MacBook本身就是这样的存储策略,低QD爆发性能强到几乎可以默秒全,高QD就菜 ...

问题是qd1也很菜啊,尤其是写

Dolfin 发表于 2023-9-12 10:07

赫敏 发表于 2023-9-12 09:58
要是pc上这种成绩出来要被喷表面固态了



英特尔的,都很糟糕。。。

fudaming 发表于 2023-9-12 10:09

本帖最后由 fudaming 于 2023-9-12 10:10 编辑

据说512的性能比1T弱,但是好像真是硬件的问题,基本只有黑苹果零头。

Dolfin 发表于 2023-9-12 10:16

fudaming 发表于 2023-9-12 10:09
据说512的性能比1T弱,但是好像真是硬件的问题,基本只有黑苹果零头。

看了M2 Max,我心里平复了很多。。。

PPXG 发表于 2023-9-12 10:20

Dolfin 发表于 2023-9-12 09:40
这个存储策略的说法很有意思,是他们的有意为之吗?

大概是吧,可以去看看这个[偷笑]
Macbook Pro storage test mbp存储测试:答辩价格,奇妙策略

PPXG 发表于 2023-9-12 10:25

赫敏 发表于 2023-9-12 10:00
问题是qd1也很菜啊,尤其是写

读很强,写很菜,而且SLC缓存释放策略保守到令人发指,不知道是否有意为之

hasuboy 发表于 2023-9-12 10:44

你这个确定不是脏盘了?

chacha20 发表于 2023-9-12 11:14

Dolfin 发表于 2023-9-12 09:34
很好,看了你的测试让我发现不是系统不行,是我硬件不行。。

这数据看起来是主控不太行,Mac那么多swap还不多堆点硬盘性能,swap多了一不小心就缓外了。

赫敏 发表于 2023-9-12 11:17

PPXG 发表于 2023-9-11 21:25
读很强,写很菜,而且SLC缓存释放策略保守到令人发指,不知道是否有意为之 ...

写的慢为了保数据,释放慢怕写入放大。毕竟基础款8g+256g内存本身就很不够了,不悠着点写入很快就坏了

Dolfin 发表于 2023-9-12 11:45

PPXG 发表于 2023-9-12 10:20
大概是吧,可以去看看这个
Macbook Pro storage test mbp存储测试:答辩价格,奇妙策略 ...

谢谢你的分享,我看了全文,有几个想法。

1.作者是怎么分别测试苹果SSD的缓内和缓外的?

2.缓内Q1T1 24万的IOPS,不到4微秒的延迟,这个数字是比P5800X还要低的,我猜测这不是SLC Cache。

3.我也使用fio 3.35做了测试,尽管机器不一样,但有一定参考性。

在缓存内,我们可以看到一个极其夸张的结果,Q1T1即达到一个夸张的数值:241k iops,这个数字什么概念,PC801在ubuntu下测出Q1T1只有21k,这已经是12倍甚至11倍的差距了,这已经不是一般的固态了,一定要出重拳!

这个数字要比我高了十倍有余,但当我在fio命令中,--direct=1 改成0,允许页面缓存之后,我达到了类似的IOPS和延迟,所以我进一步猜测它测的不是SSD。


4k随机,Q1T1,IOPS 12000, 延迟80微秒,吞吐 50.9MB/s
这是绕开页面缓存直接在SSD IO的结果。


4k随机 Q1T1, IOPS 平均12万,最高24万,延迟7微秒,吞吐 516MB/s
这是打开页面缓存的结果

chacha20 发表于 2023-9-12 12:59

本帖最后由 chacha20 于 2023-9-12 13:33 编辑

Dolfin 发表于 2023-9-12 11:45
谢谢你的分享,我看了全文,有几个想法。

1.作者是怎么分别测试苹果SSD的缓内和缓外的?


我也觉得这个SLC cache能提升10倍实在是不现实,应该是搞在内存缓存里了


980pro这种旗舰盘SLC缓存对读取的提升都不到2倍,而且SLC读对于加载速度帮助不是很大,缓外读取才是更重要的,毕竟SLC缓存都会释放。


辣鸡黑苹果开关directio没区别

Dolfin 发表于 2023-9-12 14:45

chacha20 发表于 2023-9-12 12:59
我也觉得这个SLC cache能提升10倍实在是不现实,应该是搞在内存缓存里了




嗯,我也认为是内存,Q1T1 4k随机读 674MB/s ,一个惊人的数字

ekiuc 发表于 2023-9-12 15:16

AmorphousDiskMark我跑万兆SMB的顺序写速度是BMD那个磁盘测试的1/10,不知道是哪里出了岔子……[困惑]

fudaming 发表于 2023-9-12 15:29

directIO 关



directIO 开

Dolfin 发表于 2023-9-12 16:56

fudaming 发表于 2023-9-12 15:29
directIO 关




换成psync这个同步io引擎的用意是什么?

Phil_Libra 发表于 2023-9-12 17:00

chacha20 发表于 2023-9-12 00:14
看起来M1的硬盘性能堪忧啊,黑苹果看起来还行

我艹这个4k写真nb,看了下sz1735也就200不到

fudaming 发表于 2023-9-12 17:22

本帖最后由 fudaming 于 2023-9-12 17:33 编辑

Dolfin 发表于 2023-9-12 16:56
换成psync这个同步io引擎的用意是什么?

我的macOS好像没有libaio,manpage说psync是默认的。

Dolfin 发表于 2023-9-12 17:41

fudaming 发表于 2023-9-12 17:22
我的macOS好像没有libaio,manpage说psync是默认的。

异步io引擎可以可以用posixaio

fudaming 发表于 2023-9-12 19:01

Dolfin 发表于 2023-9-12 17:41
异步io引擎可以可以用posixaio

正在看结果。

direct io off

job2: (g=0): rw=randwrite, bs=(R) 512B-512B, (W) 512B-512B, (T) 512B-512B, ioengine=posixaio, iodepth=64
fio-3.35
Starting 2 processes

job1: (groupid=0, jobs=1): err= 0: pid=27978: Tue Sep 12 17:32:14 2023
write: IOPS=54.4k, BW=212MiB/s (223MB/s)(1024MiB/4822msec); 0 zone resets
    slat (nsec): min=0, max=479000, avg=391.30, stdev=1633.04
    clat (usec): min=6, max=173373, avg=292.62, stdev=1141.94
   lat (usec): min=7, max=173373, avg=293.02, stdev=1141.93
    clat percentiles (usec):
   |1.00th=[   40],5.00th=[   53], 10.00th=[   58], 20.00th=[   68],
   | 30.00th=, 40.00th=, 50.00th=, 60.00th=,
   | 70.00th=, 80.00th=, 90.00th=, 95.00th=,
   | 99.00th=, 99.50th=[ 1106], 99.90th=[ 1745], 99.95th=[ 2057],
   | 99.99th=
   bw (KiB/s): min=73804, max=426796, per=92.97%, avg=194218.33, stdev=122151.20, samples=9
   iops      : min=18451, max=106699, avg=48554.44, stdev=30537.87, samples=9
lat (usec)   : 10=0.04%, 20=0.20%, 50=2.59%, 100=26.59%, 250=28.28%
lat (usec)   : 500=24.38%, 750=12.34%, 1000=4.65%
lat (msec)   : 2=0.86%, 4=0.04%, 10=0.01%, 20=0.01%, 50=0.01%
lat (msec)   : 100=0.01%, 250=0.01%
cpu          : usr=9.83%, sys=8.79%, ctx=111335, majf=0, minf=6
IO depths    : 1=0.1%, 2=0.1%, 4=0.5%, 8=50.9%, 16=48.5%, 32=0.0%, >=64=0.0%
   submit    : 0=0.0%, 4=100.0%, 8=0.0%, 16=0.0%, 32=0.0%, 64=0.0%, >=64=0.0%
   complete: 0=0.0%, 4=98.8%, 8=1.1%, 16=0.1%, 32=0.0%, 64=0.0%, >=64=0.0%
   issued rwts: total=0,262144,0,0 short=0,0,0,0 dropped=0,0,0,0
   latency   : target=0, window=0, percentile=100.00%, depth=64
job2: (groupid=0, jobs=1): err= 0: pid=27979: Tue Sep 12 17:32:14 2023
write: IOPS=209k, BW=102MiB/s (107MB/s)(1024MiB/10039msec); 0 zone resets
    slat (nsec): min=0, max=167000, avg=1750.70, stdev=2200.53
    clat (usec): min=5, max=20115, avg=62.46, stdev=124.83
   lat (usec): min=6, max=20115, avg=64.21, stdev=124.44
    clat percentiles (usec):
   |1.00th=[    8],5.00th=[   11], 10.00th=[   15], 20.00th=[   20],
   | 30.00th=[   23], 40.00th=[   28], 50.00th=[   32], 60.00th=[   38],
   | 70.00th=[   43], 80.00th=[   49], 90.00th=[   86], 95.00th=,
   | 99.00th=, 99.50th=, 99.90th=[ 1029], 99.95th=[ 1172],
   | 99.99th=[ 1827]
   bw (KiB/s): min= 9227, max=199510, per=48.72%, avg=101785.95, stdev=75985.57, samples=19
   iops      : min=18455, max=399021, avg=203572.26, stdev=151971.18, samples=19
lat (usec)   : 10=3.90%, 20=17.74%, 50=58.73%, 100=10.28%, 250=3.91%
lat (usec)   : 500=3.18%, 750=1.57%, 1000=0.58%
lat (msec)   : 2=0.11%, 4=0.01%, 10=0.01%, 20=0.01%, 50=0.01%
cpu          : usr=19.18%, sys=27.45%, ctx=596600, majf=0, minf=7
IO depths    : 1=1.1%, 2=6.7%, 4=17.8%, 8=58.3%, 16=16.0%, 32=0.0%, >=64=0.0%
   submit    : 0=0.0%, 4=100.0%, 8=0.0%, 16=0.0%, 32=0.0%, 64=0.0%, >=64=0.0%
   complete: 0=0.0%, 4=95.1%, 8=1.1%, 16=3.8%, 32=0.0%, 64=0.0%, >=64=0.0%
   issued rwts: total=0,2097152,0,0 short=0,0,0,0 dropped=0,0,0,0
   latency   : target=0, window=0, percentile=100.00%, depth=64

Run status group 0 (all jobs):
WRITE: bw=204MiB/s (214MB/s), 102MiB/s-212MiB/s (107MB/s-223MB/s), io=2048MiB (2147MB), run=4822-10039msec


direct io on

job2: (g=0): rw=randwrite, bs=(R) 512B-512B, (W) 512B-512B, (T) 512B-512B, ioengine=posixaio, iodepth=64
fio-3.35
Starting 2 processes

job1: (groupid=0, jobs=1): err= 0: pid=28272: Tue Sep 12 19:00:06 2023
write: IOPS=14.9k, BW=58.1MiB/s (60.9MB/s)(1024MiB/17634msec); 0 zone resets
    slat (nsec): min=0, max=114000, avg=1132.41, stdev=1641.45
    clat (usec): min=55, max=7592, avg=1072.92, stdev=551.45
   lat (usec): min=62, max=7593, avg=1074.05, stdev=551.31
    clat percentiles (usec):
   |1.00th=,5.00th=, 10.00th=, 20.00th=,
   | 30.00th=, 40.00th=, 50.00th=, 60.00th=[ 1012],
   | 70.00th=[ 1319], 80.00th=[ 1647], 90.00th=[ 1926], 95.00th=[ 2073],
   | 99.00th=[ 2343], 99.50th=[ 2474], 99.90th=[ 2999], 99.95th=[ 4359],
   | 99.99th=[ 6980]
   bw (KiB/s): min=50539, max=130415, per=100.00%, avg=59508.57, stdev=15044.74, samples=35
   iops      : min=12634, max=32603, avg=14876.86, stdev=3761.10, samples=35
lat (usec)   : 100=0.01%, 250=1.23%, 500=7.75%, 750=25.10%, 1000=25.29%
lat (msec)   : 2=33.55%, 4=7.01%, 10=0.06%
cpu          : usr=6.49%, sys=9.47%, ctx=190435, majf=0, minf=6
IO depths    : 1=0.1%, 2=0.1%, 4=0.1%, 8=46.0%, 16=54.0%, 32=0.0%, >=64=0.0%
   submit    : 0=0.0%, 4=100.0%, 8=0.0%, 16=0.0%, 32=0.0%, 64=0.0%, >=64=0.0%
   complete: 0=0.0%, 4=99.0%, 8=1.0%, 16=0.1%, 32=0.0%, 64=0.0%, >=64=0.0%
   issued rwts: total=0,262144,0,0 short=0,0,0,0 dropped=0,0,0,0
   latency   : target=0, window=0, percentile=100.00%, depth=64
job2: (groupid=0, jobs=1): err= 0: pid=28273: Tue Sep 12 19:00:06 2023
write: IOPS=16.9k, BW=8466KiB/s (8669kB/s)(1024MiB/123857msec); 0 zone resets
    slat (nsec): min=0, max=703000, avg=595.05, stdev=1112.55
    clat (usec): min=26, max=14149, avg=943.03, stdev=927.02
   lat (usec): min=29, max=14151, avg=943.62, stdev=927.04
    clat percentiles (usec):
   |1.00th=,5.00th=, 10.00th=, 20.00th=,
   | 30.00th=, 40.00th=, 50.00th=, 60.00th=,
   | 70.00th=, 80.00th=[ 1549], 90.00th=[ 2311], 95.00th=[ 3163],
   | 99.00th=[ 3392], 99.50th=[ 4228], 99.90th=[ 6980], 99.95th=[ 8455],
   | 99.99th=
   bw (KiB/s): min= 2022, max=16247, per=50.05%, avg=8474.73, stdev=1586.48, samples=246
   iops      : min= 4045, max=32495, avg=16949.91, stdev=3172.99, samples=246
lat (usec)   : 50=0.01%, 100=0.01%, 250=0.25%, 500=46.33%, 750=25.47%
lat (usec)   : 1000=4.04%
lat (msec)   : 2=12.83%, 4=10.51%, 10=0.54%, 20=0.02%
cpu          : usr=6.07%, sys=7.14%, ctx=1779154, majf=0, minf=7
IO depths    : 1=0.1%, 2=0.1%, 4=0.1%, 8=45.2%, 16=54.8%, 32=0.0%, >=64=0.0%
   submit    : 0=0.0%, 4=100.0%, 8=0.0%, 16=0.0%, 32=0.0%, 64=0.0%, >=64=0.0%
   complete: 0=0.0%, 4=99.0%, 8=1.0%, 16=0.1%, 32=0.0%, 64=0.0%, >=64=0.0%
   issued rwts: total=0,2097152,0,0 short=0,0,0,0 dropped=0,0,0,0
   latency   : target=0, window=0, percentile=100.00%, depth=64

Run status group 0 (all jobs):
WRITE: bw=16.5MiB/s (17.3MB/s), 8466KiB/s-58.1MiB/s (8669kB/s-60.9MB/s), io=2048MiB (2147MB), run=17634-123857msec

chacha20 发表于 2023-9-12 19:15

Phil_Libra 发表于 2023-9-12 17:00
我艹这个4k写真nb,看了下sz1735也就200不到

这个测试项目和Windows没有可比性,似乎差别很大,win下4k写也是200多,不过买sz1735可真有钱。。。

Phil_Libra 发表于 2023-9-12 19:18

本帖最后由 Phil_Libra 于 2023-9-12 20:50 编辑

chacha20 发表于 2023-9-12 19:15
这个测试项目和Windows没有可比性,似乎差别很大,win下4k写也是200多,不过买sz1735可真有钱。。。 ...

800G也不贵吧,也算是个收藏了,估计也没下一代了。现在就差FL6或者大普微同芯片那个没有买了。
页: [1] 2
查看完整版本: 感谢CHH问题已解决