找回密码
 加入我们
搜索
      
查看: 208|回复: 2

[电脑] WD_BLACK SN8100深度测试:成也萧何败也萧何,激进的nCache 4.0双刃剑

[复制链接]
发表于 2025-12-15 20:49 | 显示全部楼层 |阅读模式
随着PCIe 5.0时代的全面到来,我已经陆续测试了十几款PCIe 5.0 SSD,不过西部数据和SK海力士这两家存储原厂的PCIe 5.0旗舰产品却一直没机会上手体验。
前段时间趁着双11大促的好价,我终于忍不住出手,花1299元拿下了这条备受关注的WD_BLACK SN8100 2TB。
image1.png

之所以说它备受关注,不仅因为它是目前消费级SSD中的旗舰产品之一,更因为其采用的nCache 4.0缓存策略在玩家群体中引发了不小的争议。
有人说它是跑分神器,也有人质疑它是面子工程。那么,SN8100这款旗舰盘的真实表现究竟如何?是神优化还是反向升级?今天我们就通过详细的测试来一探究竟。
image2.png
产品解析
西数SN8100目前提供了1TB、2TB和4TB三种容量,尚未和三星9100 Pro、金士顿FURY Renegade G5似的推出8TB超大容量版本。
image3.png
从表格中可以看到,SN8100顺序读取最高可达14900 MB/s,顺序写入最高达到14000 MB/s
与此同时最大4K随机读取性能达到了2300 KIOPS,最大4K随机写入性能达到了2400 KIOPS
所以仅从纸面参数上来看,SN8100是目前在售消费级SSD中最高的水平,估计有很多入手SN8100的朋友就是被这个参数吸引的吧。
包装方面还是熟悉黑色纸盒,与此前我测试过的SN850X、SN7100如出一辙。
image4.png
这块盘是从京东的西部数据官方旗舰店入手,包装背面右下角贴了一张纸质合格标签,不清楚其他渠道入手有没有。
image5.png
取出SN8100 2TB,正面只有一张贴纸,不过主控位置露出了半个脑袋。
image6.png
背面看一下,已经打上了闪迪新修改过的半边拉块的LOGO:
image7.png
因为这块盘在测试完成后还准备出掉回血,所以我自己就不揭开贴纸了,找朋友要了一张照片给大家看一下:
image8.png
SN8100的主控其实就是我们熟悉的慧荣SM2508,采用6nm制程、8通道设计、FCBGA封装方式,表面为镀镍工艺,对散热比较友好。
慧荣SM2508集成了4个Arm Cortex-R8高性能核心和1个Cortex-M0低功耗核心,最高支持3600 MT/s的NAND接口速率,金士顿FURY Renegade G5、Crucial T710等今年多款PCIe 5.0有缓旗舰SSD上都在用它。
image9.png
NAND方面,SN8100 2TB与金士顿FURY Renegade G5一样,也搭载了铠侠和闪迪合资共同开发制造的BiCS8颗粒,且为1Tb大die。
BiCS8堆叠层数不算高,只有218L,不过凭借类似YMTC Xtacking的CPA(CMOS Directly Bonded to Array,CMOS直接键合存储单元阵列)架构,接口速度最高可以达到3600 MT/s,存储密度达到了18.3Gb/mm²,处于业界领先水平。
image10.png
DRAM方面,SN8100 2TB采用的是美光的DDR4颗粒,容量为2GB。这一点倒是和金士顿FURY Renegade G5和Crucial T710不一样,西数没使用常用的低功耗LPDDR4颗粒,这一点不知道是不是基于成本考虑的。
image11.png
接下来通电上机,通过CrystalDiskInfo查看S.M.A.R.T信息。可见其支持NVMe 2.0协议标准,并且预留了一部分二级OP,可用容量为2000.3 GB(10进制)。
image12.png
接下来查看更详细的S.M.A.R.T信息,SN8100提供了1个温度传感器,并且温度墙是十分激进,分别为90℃和94℃。
image13.png
功耗方面,SN8100默认给了5个档位,其中Power State 0功耗仅为8W,这算是吃到NAND与主控的先进制程红利了。
image14.png
由于二进制与十进制的单位换算差异,SN8100 2TB在Windows中的实际可用容量为1863 GiB。这并非厂家虚标,而是消费级固态硬盘普遍存在的容量显示差异。
image15.png
接下来咱们就开始正式进入测试阶段吧。
测试平台
本次测试使用的测试平台配置如下:
  • CPU:Intel i9-14900K
  • 主板:AORUS Z790 XTREME X
  • 内存:DDR5-8000 16GB x2
  • 系统盘:Intel傲腾900P 480GB
  • 系统:Windows 11专业版 23H2、Ubuntu 24.04 LTS
这里提前说明一下,在对SSD进行测试时,测试结果受硬件平台的影响会比较明显,并非所有SSD都能在每台电脑上都能跑到官方标称参数。不少网友在评论区曾经提到过,在笔记本电脑上测试同一款SSD,结果与我在台式PC上测出的有差异,这就是一个典型表现。
另外,SSD的性能除了会受到CPU主频和单核性能影响以外,整个平台的PCIe MPS(Maximum Payload Size,有效载荷)也会对测试结果产生影响——正常来讲,MPS越大,数据包传输效率越高,带宽上限更大,但相应的延迟也会增加
image16.png
目前,一般只有AMD平台才能支持512字节MPS,Intel平台只支持256字节MPS。
所以在CrystalDiskMark等一些软件的测试过程中,受Intel平台所限,SN8100的顺序读写参数无法跑到官方标注的水平,想要解决这个问题,就得换用AMD平台来进行测试了。
不过AMD处理器在SSD低队列下的读写性能一向不佳,所以个人还是习惯使用主要Intel平台来进行测试,这里请大家知悉。
基础性能测试
1.CrystalDiskMark
使用CrystalDiskMark对SN8100进行测速,可以看到这款SSD的顺序读取速度为14288.35 MB/s,顺序写入速度为13531.51 MB/s,虽然没有达到官方标称数据,不过这是因为已经达到了我这套硬件平台的PCIe 5.0 x4通道带宽上限了
image17.png
Q1T1 4K随机读取速度方面,SN8100达到了惊人的138.94 MB/s,这基本是我目前测过所有NAND SSD中最强的水平。
不过不要激动,首先这个项目是基于SLC Cache加速的表现,并不能代表实际使用时能持续达到的性能;其次,其他同样采用慧荣SM2508的旗舰PCIe 5.0 SSD在该项目中一般都不会超过120 MB/s,SN8100为何这么强?
实际上这是西数独家的混合SLC缓存算法——nCache 4.0的功劳。nCache 4.0方案能够更智能地将随机小文件数据驻留在SLC模式的缓存区,甚至利用DRAM缓存进行更激进的元数据映射。这使得在测试软件进行4K读取操作时,数据往往能直接从响应最快的缓存层级中被命中,而非必须去慢速的TLC区域搜寻。
换句话说,这是专门为了针对更高的纸面测试成绩而进行的特别调校,可以理解为面子工程。但有利也有弊,SN8100采用这个方案,也会为之付出相当的代价,这一点我们在后面会详细叙述。
在Q32T16 4K随机读写性能方面,SN8100 2TB分别达到了2199 KIOPS、1842 KIOPS的成绩,这也是被测试平台所限,没有跑满官方标称性能。
image18.png
为了更直观地为大家展示Intel和AMD平台的差距,我将SN8100 2TB放到借来的AMD 7600X+华硕B850吹雪平台上再次测试。可以看到,这次就突破了Intel平台的限制,顺序读取速度为14960.11 MB/s,顺序写入速度为14122.88 MB/s均超过了官方标称参数
image19.png
2.PCMARK 10完整系统盘基准测试
在PCMARK 10完整系统盘基准测试中,SN8100 2TB拿到了7737分,是我测试过的PCIe 5.0 SSD中最高水平,只能说这个用来跑分特供向的nCache 4.0方案确实是擅长做面子工程。
image20.png image21.png
3.3DMark存储基准测试
在3DMark存储基准测试中,SN8100 2TB拿到了7991分,同样是我测试过的PCIe 5.0 SSD中的第一名,说实话我很担心这种为了跑分好看而进行专门调校的做法会影响到整个存储行业的风气。
image22.png image23.png
4.SPECworkstation 3.1
SPEC Workstation是一款衡量专业工作站平台性能的综合测试软件,其测试特点是负载很大,对SSD混合读写性能要求也很高。同时这款软件中有专门针对存储设备进行测试的模块,可以模拟高负载生产力场景对SSD进行高压测试,尤其对SSD混合读写性能要求更高。
image24.png
说句实话,这项测试对消费级SSD要求过高,更适合企业级SSD,毕竟普通用户基本用不到这种高负载场景。不过想必也会有不少用户购买PCIe 5.0 SSD就是为了用作生产力工具的,所以这里还是来看看表现吧。
测试结果显示,SN8100 2TB在SPEC Workstation 3.1中取得了71.79分的总成绩,略逊色于金士顿FURY Renegade G5 4TB。
image25.png
专业向进阶测试
1.全盘写入曲线分析
为了深入探索SN8100 2TB的SLC缓存方案,这里我们对其进行RAW格式下的全盘范围顺序写入测试(128KB,Q32T1),并以曲线图的形式为大家展示。
从下图中可以看到,整体写入曲线呈现3段式,而且第3段曲线的波动特别明显,而写入一整遍全盘的平均速度为2816 MiB/s
image26.png
接下来我们来详细分析下这条写入曲线,还是很有意思的。
首先可以确定的是SN8100 2TB采用的是全盘模拟方案,第一段全速写入占用的SLC Cache容量约为627.8 GiB左右,正好是全部可用空间(1863 GiB)的1/3。
image27.png
而出缓后的第二段平直曲线就很有意思了,这一段的写入量是174.4 GiB左右,平均写入速度是3770 MiB/s左右,和使用类似硬件方案的金士顿FURY Renegade G5 4TB的TLC直写速度也相当接近。
而波动最大的第三段,平均写入速度为1868 MiB左右,但是上下波动极大,低至不到800 MiB/s,高至3292 MiB/s。
那么现在有趣的问题来了:
作为一款全盘模拟SSD,SN8100在第一段写入过程中就耗尽了所有可用容量(1863 GIB)模拟而来的SLC Cache,按照诸如SN850X之类全盘模拟SSD的典型表现来
说,本应直接进入速度较慢的垃圾回收阶段,也即呈现两段式曲线结构。
image28.png
那SN8100为何又有三段式曲线?它这第二段的平直写入曲线又是咋回事?
2.长时写入测试
为了进一步分析这个问题,我又使用FIO 3.36对SN8100 2TB进行了两倍全盘容量的128K Q32T1顺序写入,记录到的曲线如下:
image29.png
在这张写入曲线图中,第2段和第4段的写入曲线引起了我的警惕。它们的平均写入速度非常巧合均为3770 MiB/s左右。
image30.png
而好基友、存储区知名主包 @homolab 在介绍nCache 4.0时提到,SN8100没有所谓广义上的TLC直写的过程,而是在写满SLC Cache后,依然会“一边给SLC写入,一边往TLC区块里面释放”,直到干净的剩余块消耗完了后(第2段),进入REW读改写的爆炸阶段(第3段)。
image31.png image32.png
按这个说法,SN8100在出缓后“一边给SLC写入,一边往TLC区块里面释放”,WriteBack的过程会同时甩出脏块和干净块,当落入干净块时写入速度较高,落入脏块时需要进行擦写,速度较慢。
image33.png
那么让我想不明白的问题来了,在这个过程中,第2段曲线所代表的“干净的剩余块”从何而来?
同样是已经出缓,SN8100是如何控制先挑选干净块落入,从而形成第2段平直曲线的?难道第2段是WriteBack,第3段就不是了?
image34.png
有没有可能SN8100这第2段其实就是直写呢还是说homolab参考的nCache 4.0早期技术文档,已经无法完全代表技术迭代后的SN8100?
怀着这个疑问,我详细检查了顺序写入过程中的日志。
根据日志显示,SN8100 2TB在出缓时,已经写入了627.8 GiB左右,此时用于模拟SLC Cache的容量为628*3≈1883.4 GiB,已经超出了其在Windows中可用的1863 GiB,连少量一级OP都已经参与模拟了。
而第2段曲线过程中的写入量为174.7 GiB左右,174.7+1883.4≈2058 GiB,正好和SN8100 2TB的2048 GiB的生产容量相近。
如果假设第2段曲线是在SLC Cache耗尽后,主控调用了OP空间来进行TLC直写,那似乎能解释得通。
image36.png
如果这个假设成立的话,那第4段曲线与第2段的速度大致相同,就说得过去了——当SLC Cache内被写满的数据全部完成了垃圾回收,结束了第3段的剧烈波动后,在两种可能的情况下,都能使得第4段曲线写入速度达到TLC直写性能上限:
  • 1.该阶段和Crucial T710或者TiPro9000一样,不用先写入SLC Cache,直接执行TLC直写流程,所展示的就是正常的直写速度。
  • 2.如果nCache 4.0在这里还是要先写入SLC Cache再读出的话,由于此前已被占满的Cache空间已经全部整理完毕,此时硬盘内部的3个动作(接收主机数据、读取 SLC、写入 TLC)在全速运转中取得了平衡,达到了NAND颗粒物理吞吐的上限,同样能显示TLC直写速度。

image37.png

关于这个假设,我在前几天发布了一篇单独的贴子来讨论,结果还真有网友提醒我,有一种说法是,SN8100确实是全程都会先写入SLC Cache,只不过在写入压力太大时,从pSLC写到TLC的过程中,由于片上管理的缘故,能卡出近似直写的效果,这似乎也能解释第二段平直曲线的效果。
image38.png
不过我还是觉得第二段的写入量实在过于巧合,所以依然抱有怀疑态度,这里再次请了解详情的朋友在评论区指教。
当然不管是哪种假设,我们根据第4段的曲线都基本可以确定的是,SN8100 2TB的真实TLC直写性能应该就在3770 MiB/s左右
3.SLC缓外4K随机读取性能
关于SLC Cache缓外随机读取性能的重要性,咱们已经说过很多次了。
简单来说,SSD在低队列下的随机读取性能,是影响我们日常使用电脑时是否流畅的关键指标之一,比如我们在进行开机、打开软件、加载图片缩略图等操作时,都会用到随机读取操作。
由于SLC Cache机制会对保存其中的数据提供更加精简、准确的FTL映射,而使用CDM这些软件测试时,会有先写入测试文件——再进行测试的过程,测试成绩实际是基于SLC Cache加速后的水平,不够准确。
事实上,我们日常使用电脑时,打开软件或者加载游戏等操作,所访问的基本都是已经被挪出SLC Cache外区域内的数据,示意图如下:
image39.png
所以为了贴近实际,有必要排除SLC Cache的影响后,再对SSD随机读取速度进行测试。
由于SSD的真实工作负载非常复杂,是各种粒度、各种队列、各种读写比例的混沌系统,所以咱们在测试时很难覆盖所有场景。
一般来说,会通过观察4KB小粒度的随机读取性能来管中窥豹,对SSD进行初步的评估。
对于除西数/闪迪以外的其他品牌SSD来说,我们为了确保SSD已经完成对SLC Cache的垃圾回收过程,会先以128KB QD32顺序写入填盘2遍后,再进行15分钟的Q1T1 4K随机读取测试,最终测得SLC缓外4K随机读取速度。
但是nCache 4.0的独特机制会导致一个问题,它的SLC Cache内始终是有数据的,使用正常流程很难完全排除Cache的加速作用导致的变量,所以这里使用IOMeter来排除影响,获得了以下曲线:

image40.png
从上图中可以看到,SN8100 2TB的4K随机缓外读取速度其实在66.96 MiB/s左右,这在一众采用SM2508主控的PCIe 5.0 SSD中算是平平无奇,一点都没有nCache 4.0加持下那种神挡杀神的狂暴表现了,只能说泯然众人矣。
image41.png
4.FOB状态混合随机读写
Windows翔一样的I/O引擎和文件资源管理机制会限制SSD的性能发挥,所以为了展示SSD主控和固件在最佳工况下的性能,这里在Ubuntu 24.04中,使用FIO 3.36脚本再对SN8100 2TB进行了一遍更加完整的,不同队列深度、不同混合读写方案下的测试。
这个项目主要是为了衡量SSD主控的性能上限,所以在测试前,会确保SSD处于FOB状态,并且不排除随机读取请求命中SSD内部DRAM的情况。
将相关测试结果整理成下图的表格,大家可以拿来和其他SSD参考对比。
image42.png image43.png
如果觉得表格数据太枯燥的话,也可以参考下面几张更加直观的对比曲线图。
image44.png image45.png image46.png
5.ezFIO稳态测试
如果说刚才FOB状态下的理论性能测试,代表的是一块SSD在理想工况下的性能上限,那Steady State稳态中的性能,则代表SSD在极度脏盘、极度重负载场景下的性能下限
image47.png
对于绝大部分消费级SSD来说,实际我们日常使用时是不会进入稳态场景的,只有专门用在服务器上的企业级SSD才会考量稳态性能。
不过对于SN8100这种消费级旗舰有缓SSD来说,玩家们普遍对其抱有更高的期望,所以这里就尝试压榨它们的性能,在Ubuntu系统中引入了ezFIO测试项目,继续深挖它在极限工况下的性能细节。
image48.png
ezFIO测试主要分为顺序和随机两大项内容,为了确保SSD进入稳态,在测试开始前会有两次全盘容量顺序写入+两次全盘容量随机写入的预处理流程,之后进行不同粒度、不同队列深度的随机读写测试,整个测试流程耗时极长,负载强度极大。
在ezFIO的测试中,SN8100 2TB在7读3写长时间混合测试中的表现极为出人意料,平均IOPS倒是挺高,达到了152504,但是变异系数(可以理解为数据离散程度)真的没眼看:
image49.png
如果说同样采用SM2508主控的金士顿FURY Renegade G5、Crucial T710等消费级SSD产品,变异系数能低至5%左右,算是能勉强进入稳态的话,那SN8100高达93.51%的变异系数就真的有点闹了。
这个夸张的离散程度意味着SN8100和稳态完全无缘,后续的一系列本应基于稳态下的测试结果基本完全没有横向对比的参考价值。
这样的数据就算做解析也没啥意义,所以把图片贴出来,大家看个乐呵就行了。
image50.png
6.功耗测试
关于SSD的测试,除了温度之外,还有一项重要内容是观察其功耗。
虽然对于台式机用户来说,这点功耗带来的电费不值一提,但另外一个重点是,功耗水平可以在某种程度上侧面反映SSD的发热情况——毕竟后者测试起来是真的麻烦,即便有热电偶温度计等设备,但是考虑到探头固定和过热降速等因素,也很难排除变量干扰。
这里我拜托好基友 @WittmanARC 定制了一张M.2 SSD功耗测试卡,虽然功能上不如Quarch之类的商用功耗分析平台,但也能一用了。
对SN8100 2TB进行RAW格式下的全盘范围顺序读取测试(128KB,Q32T1)过程中,记录到的写入速度和实时功耗的图表如下所示:
image51.png
缓内高速写入的功耗,要比Crucial T710 2TB明显更低:
image52.png
但同时整体的能耗比方面的表现感觉不如致态TiPro9000 2TB:
image53.png
总结
以上就是本期关于西数SN8100 2TB的完整测试报告了,写到最后,需要做总结评价的时候,可着实让我有点为难。
image54.png
首先在硬件配置方面,除了不知为何没有用低功耗的LPDDR4颗粒外,SN8100一点问题都没有,用上了目前的旗舰主控SM2508,也用上了最好的NAND颗粒之一BICS8。
而更重要的是固件方面,SN8100在性能表现上极为鲜明优缺点都依托nCache 4.0这套方案而来。
最直接的优点是,包括SN8100在内的nCache 4.0方案产品,面子工程做的特别好,在像CrystalDiskMark、3DMark、PCMark 10等常用测试软件中的测试成绩都特别高,基本可以认为是针对跑分进行了特别调校。
同时全盘模拟方案对于写入负载不太大的用户来说其实也挺实用,能提供尽可能多的加速区间。
第三个优点是,nCache 4.0对于写入SLC Cache的数据调用也会更积极,只不过考虑到正常用户长时间使用SSD时,又不会只从SLC Cache内读取数据,所以其实感觉这一点其实也谈不上啥实用性。
而在表面成绩优秀的同时,nCache 4.0方案也给SN8100带来了不少缺点。
第一个缺点,这种全盘模拟+写入数据始终要全过一遍SLC Cache的模式,会在大容量写入的时候,带来更高的写入放大效应,不太适合经常有大容量、重负载写入需求的用户。
这个应该很好理解吧,毕竟如致态TiPro9000、金士顿G5这类产品,一方面SLC Cache不是全盘模拟,另一方面在一次性写很多数据时,写满Cache后直接就进入TLC直写阶段了,写入放大效应要比nCache 4.0方案小得多。
image55.png
第二个缺点,SN8100在面对大容量写入时也会有剧烈的波动,导致全盘的平均写入速度会比较低,堪称和三星9100 Pro有异曲同工之妙——三星是主动稳定的低速,西数是神经质一样忽高忽低。
image56.png
第三个缺点,就是nCache 4.0方案导致SN8100这块盘无法进入稳态了。
虽然我和homolab观点不同,一直认为消费级SSD实在没啥必要追求进稳态,并且更推荐大家入手DRAM less无缓SSD。但是在使用同款SM2508主控的情况下,别家竞品都能实现5%不到的变异系数,SN8100你直接来个93.51%,一点都稳不下来,这个差距已经大到让人没法忽视了——这是用DRAM based的方案做到了DRAM less的效果啊……
对家庭用户、游戏用户来说,SSD不能进稳态并没有啥影响,不过如果你想在服务器或者工作站中,用它干一些写入量较大的重负载工作的话,那我觉得这块盘不太合适。
最后总结一下吧,SN8100这款SSD,硬件方案很好,跑分成绩也很好,家用和游戏场景下性能挺棒,是旗舰产品该有的样子。
唯独需要注意的是,成也萧何败也萧何,在享受nCache 4.0的优点时,还要考虑它的一些缺点你是否能接受。
我不能说nCache 4.0不好,毕竟它的特色是如此突出。只是就我自己而言,个人不太喜欢这种剑走偏锋的方案,倒不是用起来有啥问题,单纯就是心理因素影响,更喜欢稳妥一些的消费级SSD。



image35.png
发表于 2025-12-15 21:26 来自手机 | 显示全部楼层
感谢分享!
发表于 2025-12-16 01:16 | 显示全部楼层
为了跑分而跑分的设计
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-12-16 09:00 , Processed in 0.027920 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表