找回密码
 加入我们
搜索
      
查看: 11259|回复: 40

[存储] 感谢CHH问题已解决

[复制链接]
发表于 2023-9-11 20:34 | 显示全部楼层 |阅读模式
本帖最后由 Dolfin 于 2023-12-5 10:19 编辑

感谢CHH问题已解决
截屏2023-09-11-19.58.54.png
截屏2023-09-11 20.09.56.png
截屏2023-09-11 20.15.43.png
发表于 2023-9-12 00:14 | 显示全部楼层
看起来M1的硬盘性能堪忧啊,黑苹果看起来还行

截屏2023-09-12 00.11.18.png 截屏2023-09-12 00.13.49.png
发表于 2023-9-12 00:33 来自手机 | 显示全部楼层
因为MacBook本身就是这样的存储策略,低QD爆发性能强到几乎可以默秒全,高QD就菜
发表于 2023-9-12 04:32 | 显示全部楼层
本帖最后由 赫敏 于 2023-9-11 15:34 编辑

自家半吊子主控是这样的。但QD64的成绩本身就是玄学没必要看,最重要的永远是QD1T1 4k
 楼主| 发表于 2023-9-12 09:34 | 显示全部楼层
chacha20 发表于 2023-9-12 00:14
看起来M1的硬盘性能堪忧啊,黑苹果看起来还行

很好,看了你的测试让我发现不是系统不行,是我硬件不行。。
 楼主| 发表于 2023-9-12 09:40 | 显示全部楼层
PPXG 发表于 2023-9-12 00:33
因为MacBook本身就是这样的存储策略,低QD爆发性能强到几乎可以默秒全,高QD就菜 ...

这个存储策略的说法很有意思,是他们的有意为之吗?
 楼主| 发表于 2023-9-12 09:45 | 显示全部楼层
赫敏 发表于 2023-9-12 04:32
自家半吊子主控是这样的。但QD64的成绩本身就是玄学没必要看,最重要的永远是QD1T1 4k ...

确实不会有什么深队列的场景,不过深队列的4k随机成绩在我测试里和windows或者其它系统间的差异巨大,甚至在同一个MACOS平台下,不同的测试软件(iozone, fio, adm, atto db)成绩也差异巨大,我都怀疑没有一个表现是真实的
发表于 2023-9-12 09:49 | 显示全部楼层
Dolfin 发表于 2023-9-11 20:45
确实不会有什么深队列的场景,不过深队列的4k随机成绩在我测试里和windows或者其它系统间的差异巨大,甚 ...

不看高QD,单一个QD1 4k写苹果也够菜了。而且我觉得m1比以前Intel平台的磁盘性能还要菜
发表于 2023-9-12 09:58 | 显示全部楼层
本帖最后由 赫敏 于 2023-9-11 20:59 编辑

要是pc上这种成绩出来要被喷表面固态了
iScreen Shoter - AmorphousDiskMark - 230911215717.png
发表于 2023-9-12 10:00 | 显示全部楼层
PPXG 发表于 2023-9-11 11:33
因为MacBook本身就是这样的存储策略,低QD爆发性能强到几乎可以默秒全,高QD就菜 ...

问题是qd1也很菜啊,尤其是写
 楼主| 发表于 2023-9-12 10:07 | 显示全部楼层
赫敏 发表于 2023-9-12 09:58
要是pc上这种成绩出来要被喷表面固态了

截屏2023-09-12 上午10.06.21.png

英特尔的,都很糟糕。。。
发表于 2023-9-12 10:09 | 显示全部楼层
本帖最后由 fudaming 于 2023-9-12 10:10 编辑

据说512的性能比1T弱,但是好像真是硬件的问题,基本只有黑苹果零头。
截屏2023-09-12 10.08.24.png
 楼主| 发表于 2023-9-12 10:16 | 显示全部楼层
fudaming 发表于 2023-9-12 10:09
据说512的性能比1T弱,但是好像真是硬件的问题,基本只有黑苹果零头。

看了M2 Max,我心里平复了很多。。。
发表于 2023-9-12 10:20 来自手机 | 显示全部楼层
Dolfin 发表于 2023-9-12 09:40
这个存储策略的说法很有意思,是他们的有意为之吗?


大概是吧,可以去看看这个
Macbook Pro storage test mbp存储测试:答辩价格,奇妙策略
发表于 2023-9-12 10:25 | 显示全部楼层
赫敏 发表于 2023-9-12 10:00
问题是qd1也很菜啊,尤其是写

读很强,写很菜,而且SLC缓存释放策略保守到令人发指,不知道是否有意为之
发表于 2023-9-12 10:44 | 显示全部楼层
你这个确定不是脏盘了?
发表于 2023-9-12 11:14 | 显示全部楼层
Dolfin 发表于 2023-9-12 09:34
很好,看了你的测试让我发现不是系统不行,是我硬件不行。。

这数据看起来是主控不太行,Mac那么多swap还不多堆点硬盘性能,swap多了一不小心就缓外了。
发表于 2023-9-12 11:17 | 显示全部楼层
PPXG 发表于 2023-9-11 21:25
读很强,写很菜,而且SLC缓存释放策略保守到令人发指,不知道是否有意为之 ...

写的慢为了保数据,释放慢怕写入放大。毕竟基础款8g+256g内存本身就很不够了,不悠着点写入很快就坏了
 楼主| 发表于 2023-9-12 11:45 | 显示全部楼层
PPXG 发表于 2023-9-12 10:20
大概是吧,可以去看看这个
Macbook Pro storage test mbp存储测试:答辩价格,奇妙策略 ...


谢谢你的分享,我看了全文,有几个想法。

1.作者是怎么分别测试苹果SSD的缓内和缓外的?

2.缓内Q1T1 24万的IOPS,不到4微秒的延迟,这个数字是比P5800X还要低的,我猜测这不是SLC Cache。

3.我也使用fio 3.35做了测试,尽管机器不一样,但有一定参考性。

在缓存内,我们可以看到一个极其夸张的结果,Q1T1即达到一个夸张的数值:241k iops,这个数字什么概念,PC801在ubuntu下测出Q1T1只有21k,这已经是12倍甚至11倍的差距了,这已经不是一般的固态了,一定要出重拳!


这个数字要比我高了十倍有余,但当我在fio命令中,--direct=1 改成0,允许页面缓存之后,我达到了类似的IOPS和延迟,所以我进一步猜测它测的不是SSD。

截屏2023-09-12 上午11.21.29.png
4k随机,Q1T1,IOPS 12000, 延迟80微秒,吞吐 50.9MB/s
这是绕开页面缓存直接在SSD IO的结果。

截屏2023-09-12 上午11.20.34.png
4k随机 Q1T1, IOPS 平均12万,最高24万,延迟7微秒,吞吐 516MB/s
这是打开页面缓存的结果
发表于 2023-9-12 12:59 | 显示全部楼层
本帖最后由 chacha20 于 2023-9-12 13:33 编辑
Dolfin 发表于 2023-9-12 11:45
谢谢你的分享,我看了全文,有几个想法。

1.作者是怎么分别测试苹果SSD的缓内和缓外的?


我也觉得这个SLC cache能提升10倍实在是不现实,应该是搞在内存缓存里了


980pro这种旗舰盘SLC缓存对读取的提升都不到2倍,而且SLC读对于加载速度帮助不是很大,缓外读取才是更重要的,毕竟SLC缓存都会释放。


辣鸡黑苹果开关directio没区别

截屏2023-09-12 13.33.12.png
 楼主| 发表于 2023-9-12 14:45 | 显示全部楼层
chacha20 发表于 2023-9-12 12:59
我也觉得这个SLC cache能提升10倍实在是不现实,应该是搞在内存缓存里了

嗯,我也认为是内存,Q1T1 4k随机读 674MB/s ,一个惊人的数字
发表于 2023-9-12 15:16 | 显示全部楼层
AmorphousDiskMark我跑万兆SMB的顺序写速度是BMD那个磁盘测试的1/10,不知道是哪里出了岔子……
发表于 2023-9-12 15:29 | 显示全部楼层
directIO 关
截屏2023-09-12 15.27.46.png


directIO 开
截屏2023-09-12 15.28.36.png
 楼主| 发表于 2023-9-12 16:56 | 显示全部楼层

换成psync这个同步io引擎的用意是什么?
发表于 2023-9-12 17:00 来自手机 | 显示全部楼层
chacha20 发表于 2023-9-12 00:14
看起来M1的硬盘性能堪忧啊,黑苹果看起来还行

我艹这个4k写真nb,看了下sz1735也就200不到
发表于 2023-9-12 17:22 | 显示全部楼层
本帖最后由 fudaming 于 2023-9-12 17:33 编辑
Dolfin 发表于 2023-9-12 16:56
换成psync这个同步io引擎的用意是什么?


我的macOS好像没有libaio,manpage说psync是默认的。

截屏2023-09-12 17.30.47.png
 楼主| 发表于 2023-9-12 17:41 来自手机 | 显示全部楼层
fudaming 发表于 2023-9-12 17:22
我的macOS好像没有libaio,manpage说psync是默认的。

异步io引擎可以可以用posixaio
发表于 2023-9-12 19:01 | 显示全部楼层
Dolfin 发表于 2023-9-12 17:41
异步io引擎可以可以用posixaio

正在看结果。

direct io off

  1. job2: (g=0): rw=randwrite, bs=(R) 512B-512B, (W) 512B-512B, (T) 512B-512B, ioengine=posixaio, iodepth=64
  2. fio-3.35
  3. Starting 2 processes

  4. job1: (groupid=0, jobs=1): err= 0: pid=27978: Tue Sep 12 17:32:14 2023
  5.   write: IOPS=54.4k, BW=212MiB/s (223MB/s)(1024MiB/4822msec); 0 zone resets
  6.     slat (nsec): min=0, max=479000, avg=391.30, stdev=1633.04
  7.     clat (usec): min=6, max=173373, avg=292.62, stdev=1141.94
  8.      lat (usec): min=7, max=173373, avg=293.02, stdev=1141.93
  9.     clat percentiles (usec):
  10.      |  1.00th=[   40],  5.00th=[   53], 10.00th=[   58], 20.00th=[   68],
  11.      | 30.00th=[  102], 40.00th=[  151], 50.00th=[  198], 60.00th=[  265],
  12.      | 70.00th=[  355], 80.00th=[  469], 90.00th=[  635], 95.00th=[  766],
  13.      | 99.00th=[  988], 99.50th=[ 1106], 99.90th=[ 1745], 99.95th=[ 2057],
  14.      | 99.99th=[68682]
  15.    bw (  KiB/s): min=73804, max=426796, per=92.97%, avg=194218.33, stdev=122151.20, samples=9
  16.    iops        : min=18451, max=106699, avg=48554.44, stdev=30537.87, samples=9
  17.   lat (usec)   : 10=0.04%, 20=0.20%, 50=2.59%, 100=26.59%, 250=28.28%
  18.   lat (usec)   : 500=24.38%, 750=12.34%, 1000=4.65%
  19.   lat (msec)   : 2=0.86%, 4=0.04%, 10=0.01%, 20=0.01%, 50=0.01%
  20.   lat (msec)   : 100=0.01%, 250=0.01%
  21.   cpu          : usr=9.83%, sys=8.79%, ctx=111335, majf=0, minf=6
  22.   IO depths    : 1=0.1%, 2=0.1%, 4=0.5%, 8=50.9%, 16=48.5%, 32=0.0%, >=64=0.0%
  23.      submit    : 0=0.0%, 4=100.0%, 8=0.0%, 16=0.0%, 32=0.0%, 64=0.0%, >=64=0.0%
  24.      complete  : 0=0.0%, 4=98.8%, 8=1.1%, 16=0.1%, 32=0.0%, 64=0.0%, >=64=0.0%
  25.      issued rwts: total=0,262144,0,0 short=0,0,0,0 dropped=0,0,0,0
  26.      latency   : target=0, window=0, percentile=100.00%, depth=64
  27. job2: (groupid=0, jobs=1): err= 0: pid=27979: Tue Sep 12 17:32:14 2023
  28.   write: IOPS=209k, BW=102MiB/s (107MB/s)(1024MiB/10039msec); 0 zone resets
  29.     slat (nsec): min=0, max=167000, avg=1750.70, stdev=2200.53
  30.     clat (usec): min=5, max=20115, avg=62.46, stdev=124.83
  31.      lat (usec): min=6, max=20115, avg=64.21, stdev=124.44
  32.     clat percentiles (usec):
  33.      |  1.00th=[    8],  5.00th=[   11], 10.00th=[   15], 20.00th=[   20],
  34.      | 30.00th=[   23], 40.00th=[   28], 50.00th=[   32], 60.00th=[   38],
  35.      | 70.00th=[   43], 80.00th=[   49], 90.00th=[   86], 95.00th=[  277],
  36.      | 99.00th=[  685], 99.50th=[  799], 99.90th=[ 1029], 99.95th=[ 1172],
  37.      | 99.99th=[ 1827]
  38.    bw (  KiB/s): min= 9227, max=199510, per=48.72%, avg=101785.95, stdev=75985.57, samples=19
  39.    iops        : min=18455, max=399021, avg=203572.26, stdev=151971.18, samples=19
  40.   lat (usec)   : 10=3.90%, 20=17.74%, 50=58.73%, 100=10.28%, 250=3.91%
  41.   lat (usec)   : 500=3.18%, 750=1.57%, 1000=0.58%
  42.   lat (msec)   : 2=0.11%, 4=0.01%, 10=0.01%, 20=0.01%, 50=0.01%
  43.   cpu          : usr=19.18%, sys=27.45%, ctx=596600, majf=0, minf=7
  44.   IO depths    : 1=1.1%, 2=6.7%, 4=17.8%, 8=58.3%, 16=16.0%, 32=0.0%, >=64=0.0%
  45.      submit    : 0=0.0%, 4=100.0%, 8=0.0%, 16=0.0%, 32=0.0%, 64=0.0%, >=64=0.0%
  46.      complete  : 0=0.0%, 4=95.1%, 8=1.1%, 16=3.8%, 32=0.0%, 64=0.0%, >=64=0.0%
  47.      issued rwts: total=0,2097152,0,0 short=0,0,0,0 dropped=0,0,0,0
  48.      latency   : target=0, window=0, percentile=100.00%, depth=64

  49. Run status group 0 (all jobs):
  50.   WRITE: bw=204MiB/s (214MB/s), 102MiB/s-212MiB/s (107MB/s-223MB/s), io=2048MiB (2147MB), run=4822-10039msec
复制代码


direct io on

  1. job2: (g=0): rw=randwrite, bs=(R) 512B-512B, (W) 512B-512B, (T) 512B-512B, ioengine=posixaio, iodepth=64
  2. fio-3.35
  3. Starting 2 processes

  4. job1: (groupid=0, jobs=1): err= 0: pid=28272: Tue Sep 12 19:00:06 2023
  5.   write: IOPS=14.9k, BW=58.1MiB/s (60.9MB/s)(1024MiB/17634msec); 0 zone resets
  6.     slat (nsec): min=0, max=114000, avg=1132.41, stdev=1641.45
  7.     clat (usec): min=55, max=7592, avg=1072.92, stdev=551.45
  8.      lat (usec): min=62, max=7593, avg=1074.05, stdev=551.31
  9.     clat percentiles (usec):
  10.      |  1.00th=[  237],  5.00th=[  404], 10.00th=[  523], 20.00th=[  652],
  11.      | 30.00th=[  725], 40.00th=[  783], 50.00th=[  848], 60.00th=[ 1012],
  12.      | 70.00th=[ 1319], 80.00th=[ 1647], 90.00th=[ 1926], 95.00th=[ 2073],
  13.      | 99.00th=[ 2343], 99.50th=[ 2474], 99.90th=[ 2999], 99.95th=[ 4359],
  14.      | 99.99th=[ 6980]
  15.    bw (  KiB/s): min=50539, max=130415, per=100.00%, avg=59508.57, stdev=15044.74, samples=35
  16.    iops        : min=12634, max=32603, avg=14876.86, stdev=3761.10, samples=35
  17.   lat (usec)   : 100=0.01%, 250=1.23%, 500=7.75%, 750=25.10%, 1000=25.29%
  18.   lat (msec)   : 2=33.55%, 4=7.01%, 10=0.06%
  19.   cpu          : usr=6.49%, sys=9.47%, ctx=190435, majf=0, minf=6
  20.   IO depths    : 1=0.1%, 2=0.1%, 4=0.1%, 8=46.0%, 16=54.0%, 32=0.0%, >=64=0.0%
  21.      submit    : 0=0.0%, 4=100.0%, 8=0.0%, 16=0.0%, 32=0.0%, 64=0.0%, >=64=0.0%
  22.      complete  : 0=0.0%, 4=99.0%, 8=1.0%, 16=0.1%, 32=0.0%, 64=0.0%, >=64=0.0%
  23.      issued rwts: total=0,262144,0,0 short=0,0,0,0 dropped=0,0,0,0
  24.      latency   : target=0, window=0, percentile=100.00%, depth=64
  25. job2: (groupid=0, jobs=1): err= 0: pid=28273: Tue Sep 12 19:00:06 2023
  26.   write: IOPS=16.9k, BW=8466KiB/s (8669kB/s)(1024MiB/123857msec); 0 zone resets
  27.     slat (nsec): min=0, max=703000, avg=595.05, stdev=1112.55
  28.     clat (usec): min=26, max=14149, avg=943.03, stdev=927.02
  29.      lat (usec): min=29, max=14151, avg=943.62, stdev=927.04
  30.     clat percentiles (usec):
  31.      |  1.00th=[  314],  5.00th=[  375], 10.00th=[  404], 20.00th=[  437],
  32.      | 30.00th=[  465], 40.00th=[  486], 50.00th=[  510], 60.00th=[  537],
  33.      | 70.00th=[  685], 80.00th=[ 1549], 90.00th=[ 2311], 95.00th=[ 3163],
  34.      | 99.00th=[ 3392], 99.50th=[ 4228], 99.90th=[ 6980], 99.95th=[ 8455],
  35.      | 99.99th=[11338]
  36.    bw (  KiB/s): min= 2022, max=16247, per=50.05%, avg=8474.73, stdev=1586.48, samples=246
  37.    iops        : min= 4045, max=32495, avg=16949.91, stdev=3172.99, samples=246
  38.   lat (usec)   : 50=0.01%, 100=0.01%, 250=0.25%, 500=46.33%, 750=25.47%
  39.   lat (usec)   : 1000=4.04%
  40.   lat (msec)   : 2=12.83%, 4=10.51%, 10=0.54%, 20=0.02%
  41.   cpu          : usr=6.07%, sys=7.14%, ctx=1779154, majf=0, minf=7
  42.   IO depths    : 1=0.1%, 2=0.1%, 4=0.1%, 8=45.2%, 16=54.8%, 32=0.0%, >=64=0.0%
  43.      submit    : 0=0.0%, 4=100.0%, 8=0.0%, 16=0.0%, 32=0.0%, 64=0.0%, >=64=0.0%
  44.      complete  : 0=0.0%, 4=99.0%, 8=1.0%, 16=0.1%, 32=0.0%, 64=0.0%, >=64=0.0%
  45.      issued rwts: total=0,2097152,0,0 short=0,0,0,0 dropped=0,0,0,0
  46.      latency   : target=0, window=0, percentile=100.00%, depth=64

  47. Run status group 0 (all jobs):
  48.   WRITE: bw=16.5MiB/s (17.3MB/s), 8466KiB/s-58.1MiB/s (8669kB/s-60.9MB/s), io=2048MiB (2147MB), run=17634-123857msec
复制代码
发表于 2023-9-12 19:15 | 显示全部楼层
Phil_Libra 发表于 2023-9-12 17:00
我艹这个4k写真nb,看了下sz1735也就200不到

这个测试项目和Windows没有可比性,似乎差别很大,win下4k写也是200多,不过买sz1735可真有钱。。。
发表于 2023-9-12 19:18 | 显示全部楼层
本帖最后由 Phil_Libra 于 2023-9-12 20:50 编辑
chacha20 发表于 2023-9-12 19:15
这个测试项目和Windows没有可比性,似乎差别很大,win下4k写也是200多,不过买sz1735可真有钱。。。 ...


800G也不贵吧,也算是个收藏了,估计也没下一代了。现在就差FL6或者大普微同芯片那个没有买了。
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-4-28 16:14 , Processed in 0.014745 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表