找回密码
 加入我们
搜索
      
查看: 115294|回复: 316

[存储] [三喷阵列]对大部分人来说阵列不安全 无意义 不要用

 火.. [复制链接]
发表于 2022-2-8 12:17 | 显示全部楼层 |阅读模式
本帖最后由 灰羽利亞 于 2024-1-10 11:19 编辑

前两次讨论发在水区,水区不会被搜索引擎收录,这次转硬件区总结一次。
1、阵列不是备份,阵列不保证数据安全,如果一定要数据安全,还需要备份。
2、阵列坏了一块硬盘后,替换硬盘重建很难,很花时间,5个2T R5 在一直跑在线系统的情况下,恢复可能要一周时间。
3、阵列在重建过程中可能坏第二块盘。
4、阵列需要定期一致性检查、校验数据。否则会出现不读数据不报错,读到损坏的数据才报错,这时候通常已经不止一个错误。
5、阵列维护需要专业知识,不专业的人用阵列请勿存储重要资料,只用来学习、玩。
6、阵列不防勒索病毒、火灾、停电、雷击、小偷、手贱开机拔硬盘、误删除数据。遇到某些问题有阵列比没阵列恢复数据更难。而异地冷备、增量异地热备、网盘增量热备2份或更多,能防止这些问题。
7、大企业上阵列的首要因素是在线率,而不是资料安全,他们的阵列后面有好几套备份,不依靠阵列保证数据安全。
8、阵列上了以后很难拆除,因为资料都在上面,需要另准备能装下资料的盘,并且这些盘还得能接入系统,不论是通过sata、usb还是网卡接入传输资料。上了阵列再随意变动机器的硬件(如硬件diy常规操作)可能导致阵列崩溃,所以上了阵列后对硬件的更新、操作有限制。
9、群晖千人群每月都有阵列挂掉并且数据丢失的案例。
10、阵列恢复需要专业知识,如果你不懂、没操作过、只在网上看过简单的视频、文字教程,那么你的阵列挂掉一个盘后重建几率必须看作0。

在百度、b站搜阵列、raid,你得不到上面的大部分信息。
在百度、b站搜“阵列 缺点”“raid 缺点”“阵列 注意事项”你也得不到上面的大部分信息,包括搜出来的首页的看起很专业的资料。甚至说raid1是万无一失的存储方案
(以下链接不代表文章不好,只代表在网络上很难找到我说的这些点)
https://www.cnblogs.com/chuncn/p/6008173.html
https://zhuanlan.zhihu.com/p/309880501
https://blog.csdn.net/Rio520/article/details/102322603
http://www.sosit.com.cn/de_news/de_yjxw/5070.html

只有在搜索“阵列 备份”这类关键词才能搜出一些我说的这些信息,而大部分人在接触阵列时不会知道要搜哪些资料、怎么学习。

而实际应用中,很多小白就被坑了,无脑觉得上阵列比不上阵列好,甚至不知道阵列的具体事项。
1.JPG
2.JPG


以上除了定期一致性检查,都是谈基础的安全,没谈性能方面的缺点,如r5 随机读写性能等,我就见过不少文章大吹r5、r6又安全速度又快,结果小文件随机读写狗屎不知道、不说。我很反感那些吹优点不说缺点的人,也很反感“阵列技术没错,错的是用的人”这种话,这些人都是“阵列大佬”们带出来的,错的是谁?大佬们写文章只知道吹吗?


==========================================================================
第一次编辑
放上第二次在水区发帖的链接,没chh账号的人应该访问不了。第一次发的贴有点久远,翻不到了。
https://www.chiphell.com/thread-2391331-1-1.html

=====================================================================================
第二次编辑
请不要在这贴大吹raid好,企业级牛逼,对个人这么吹只会带坏小白
我说大部分人不需要raid,raid有xxxx缺点。你们就大吹raid好。
这就是我说的“阵列大佬”,从不问实际,一堆理论知识。狂吹raid好,都以为各个是raid高手+家里有3组6块盘的raid6,实际他们手上就4块盘,两块主存储,一块热备,一块冷备。

这样的人回复一堆一堆的,真的会带坏那些小白。小白一听一堆人吹+企业级,再加上没有途径了解到raid的危害,直接把自己全盘都上了raid,没有备份、不知道阵列坏了怎么处理、硬盘坏了连替换的盘都没有。


================================================================================
第三次编辑
病毒离我们很远?很近!
https://www.chiphell.com/thread-2395200-1-1.html

1、这个病毒会加密你的nas上的所有有用资料,让你只能登录系统,不能读取有用的存储文件。
2、威联通这种中小企业、个人领域老二地位的nas系统也受到了攻击。
3、你的密码是强密码没用,你时刻将自己的系统更新到最新系统、打上所有的安全补丁没用,组了阵列没用。
4、这时候唯有第三方增量热备、冷备等策略能拯救被加密的数据。
5、任何系统都有漏洞,大部分漏洞会在被黑之前由官方打补丁修复,少数漏洞是被利用后才被修复,这种最可怕。
6、商业系统通常漏洞修复都比较及时,开源、自建系统的漏洞修复通常不及时,这也是我尝试过omv、next cloud、freenas后,还是决定买群晖的原因之一,虽然这三者也比较商业,但由于这些系统可安装在各种机器上,不可控因素多,而群晖整个机器硬件软件都是自家的,厂家对机器可控性强很多。

================================================================================
第四次编辑 24年1月10日
看到很多人回复“企业不知道,家庭上raid吃饱了撑着”之类的话,我就觉得我这贴有意义.我的目的达到了.
我的目的并不是否认阵列的意义,而是什么环境用什么功能,把钱投到最有价值的点(多盘阵列&单盘备份),纠正“阵列=非常安全”这一diy爱好者固有思想.

评分

参与人数 3邪恶指数 +20 收起 理由
summerq + 5 赞同。阵列是为了resilience
HowardTsai9 + 10
Wolverine + 5 666

查看全部评分

发表于 2024-9-4 09:37 | 显示全部楼层
斩龙 发表于 2024-9-3 23:25
楼上只是说硬盘故障率吧。
我来简单理解一下:
假设我用西数HC550 16T,我们来假设可靠性是0.9,

你这计算。。。。

单个盘的可靠性如果是r ,那么整体硬盘组的可靠性(仅硬盘)就是N*r ,这是自然故障率与是否阵列无关。换句话说 不论你组不组阵列 可靠性都是一样的。

但是请注意,我们讨论的是数据完整和可靠性,因为阵列可以允许部分硬盘损坏而不损失数据。那么按照12个硬盘计算可靠性应该如下:
JBOD      54%
R0           54%
R1           99%
R0+1       93%
R10         99%
R3           88%
R5           88%
发表于 2024-9-4 09:05 | 显示全部楼层
阵列不是100%安全,但有它的用途,你不能说“不要用”!
发表于 2024-9-4 09:05 来自手机 | 显示全部楼层
本帖最后由 皛羽控 于 2024-9-4 11:08 编辑

这么low的大字报还能待那么久再次拉低论坛的底限。全是自己先射箭再画靶的玩意儿。
独立硬盘冗余阵列(RAID, Redundant Array of Independent Disks),旧称廉价磁盘冗余阵列(Redundant Array of Inexpensive Disks),简称磁盘阵列。利用虚拟化存储技术把多个硬盘组合起来,成为一个或多个硬盘阵列组,目的为提升性能或资料冗余,或是两者同时提升。
有一句话提到你说的安全备份吗。
发表于 2024-9-4 08:59 | 显示全部楼层
斩龙 发表于 2024-9-3 23:25
楼上只是说硬盘故障率吧。
我来简单理解一下:
假设我用西数HC550 16T,我们来假设可靠性是0.9,

其实白塞尔公式  应该可以算  我们测绘上 用这个公式来计算误差传播
这个里面用故障率替换误差的话   感觉也可以  但是不严密
发表于 2024-9-3 23:41 | 显示全部楼层
用JBOD的前提是自身(应用层)有2-3倍甚至更高的冗余倍率和一致性检查,保证了数据的安全性,从而使得RAID提供的安全性不再必要,从而解放为RAID牺牲的性能,比如hadoop hdfs默认就推荐用jbod,因为他最少要求你提供2份备份

正经的使用场合,有用的数据,不会有人数据只存一份,只存在一个盘上,而没有任何校验信息和备份的
发表于 2024-9-3 23:31 | 显示全部楼层
斩龙 发表于 2024-9-3 23:25
楼上只是说硬盘故障率吧。
我来简单理解一下:
假设我用西数HC550 16T,我们来假设可靠性是0.9,

硬盘整体可靠性要看组的是什么阵列,才能算出来。
做raid0的话适用你算出来的0.81。
做别的raid不是这样算的。
发表于 2024-9-3 23:25 | 显示全部楼层
本帖最后由 斩龙 于 2024-9-4 10:50 编辑
gzpony 发表于 2024-9-3 23:02
没学懂概率?做阵列故障更大的话,这么多IT企业都这么蠢吗?


楼上只是说硬盘故障率吧。
我来简单理解一下:
假设我用西数HC550 16T,我们来假设硬盘单盘连续运行质量可靠性是99.7%(Backblaze,全年硬盘故障率报告,HC550 16T的L0和L4这三年的 afr有0.12%也有0.3%),
这样只要JBOD单盘使用,硬盘单盘质量可靠性一直就是99.7%,
但只要是组阵列哪怕是最简单的RAID0和RAID1,那2块硬盘必须同时在运转,那2块硬盘同时运行的整体质量可靠性就是99.7%x99.7%=99.4%(非阵列可靠性,而是硬盘本身质量的可靠性)。
组阵列肯定是另一套算法了,知乎这里有磁盘阵列可靠性计算。
https://zhuanlan.zhihu.com/p/340318826

组RAID的目的在于提高冗余,其中一块HDD出问题可以换上另一块HDD无损使用。
-----------------------

JBOD单盘使用HDD的最大的问题在于,个人使用的时候,经常有出现在硬盘运行的时候移动机箱、脚踢机箱、突然断电、买到叠瓦盘、硬盘供电有问题等各种奇葩的情况,将0.997的可靠性拉到很低。
发表于 2024-9-3 23:02 | 显示全部楼层
starlight 发表于 2024-9-3 18:57
我反正就觉得 JBOD  最好    什么0  1   3  5的  都是一块坏  都要出问题   
而且那么多硬盘都有各自的故 ...

没学懂概率?做阵列故障更大的话,这么多IT企业都这么蠢吗?
发表于 2024-9-3 18:57 | 显示全部楼层
我反正就觉得 JBOD  最好    什么0  1   3  5的  都是一块坏  都要出问题   
而且那么多硬盘都有各自的故障率   要是做了阵列   故障率也加起来了   按平方和为最小值来计算     做阵列的故障率更高     感觉哈
发表于 2024-9-3 17:03 | 显示全部楼层
为大佬点赞
发表于 2024-1-11 11:35 | 显示全部楼层
本帖最后由 ssl0008 于 2024-1-12 12:02 编辑

阵列应该跟单盘比,扯备份干啥?把你的理由替换成单盘,发现理由更加充分:
1、单盘不是备份,单盘不保证数据安全,如果一定要数据安全,还需要备份。
2、单盘坏了一块硬盘后,就是坏了
3、单盘不能重建
4、单盘需要定期一致性检查、校验数据。否则会出现不读数据不报错,读到损坏的数据才报错,这时候通常已经不止一个错误。
5、大量单盘维护连专业知识都搞不定,需要堆人力。
6、单盘不防勒索病毒、火灾、停电、雷击、小偷、手贱开机拔硬盘、误删除数据。遇到大部分问题单盘都比阵列恢复数据更难。而异地冷备、增量异地热备、网盘增量热备2份或更多,能防止这些问题。
7、大企业不上单盘
8、单盘上了以后很难拆除,因为资料都在上面,需要另准备能装下资料的盘,并且这些盘还得能接入系统,不论是通过sata、usb还是网卡接入传输资料
9、单盘挂掉并且数据丢失的案例自古至今数不胜数
10、单盘恢复连专业知识都不一定搞得定

编辑:都300楼了这楼主还是认为(阵列/备份)是对立的选择,连阵列可以备份都搞不清楚就在乱喷

点评

有阵列的人一定有多块盘,可以在阵列\备份之间选择,有单盘的人一定没有多块盘,你应该没搞懂这个逻辑就乱喷.  发表于 2024-1-12 11:53
发表于 2024-1-11 10:40 | 显示全部楼层
整列的好处被直接无视了呗,就一句企业在线率带过了?

读写速度大幅度提升,就现在千兆网络,内网普遍2.5G,读写速度的提升就是必要的事情。

阵列可以保证损坏损坏一盘的情况下有备份数据的时间,单盘就听天由命吧

总结一下:阵列  损失几个盘的容量获取 更高的读写速度,和损坏响应时间。这两个典型特征就可以把单盘按在地上摩擦。


再讲一下数据安全,数据安全和组阵列或者单盘有什么关系?毫无关系,高度数据安全的方法只有一个多途径备份。


最后强调一下: 阵列发生降级,第一时间是备份数据,然后在恢复阵列。
发表于 2024-1-10 12:43 | 显示全部楼层
完全不同意,我就用raid z,就是zfs 的raid 5,硬盘也坏过,恢复速度非常快,基本上不会存在恢复的过程中再坏一块,概率太低了。
用raid z后,读写速度提高了,也更加安全
发表于 2024-1-10 12:36 | 显示全部楼层
星空小琛 发表于 2024-1-10 12:36
所以现在存储很多都是纠删码或者多副本了

单台存储直接JBOD完事
发表于 2024-1-10 12:36 | 显示全部楼层
所以现在存储很多都是纠删码或者多副本了
发表于 2024-1-10 12:19 来自手机 | 显示全部楼层
huihuige 发表于 2024-1-10 10:31
不好意思 大佬
还得麻烦请教下
折腾了半天java终于让这个MSM运行了

兼容远程管理
本地就输入本机ip,或者127.0.0.1
win账号密码登录
发表于 2024-1-10 11:05 | 显示全部楼层
单位不知道,家里上阵列我感觉是吃饱了撑的
发表于 2024-1-10 10:31 | 显示全部楼层
zealotxx 发表于 2024-1-9 14:00
lsi msm
MegaRAID Storage Manager

不好意思 大佬
还得麻烦请教下
折腾了半天java终于让这个MSM运行了
可是他需要远程登录?
不能本地运行么?
我打开后界面是“发现server”
然后找不到
什么都不显示
微信图片_20240110103016.jpg
发表于 2024-1-10 09:16 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
发表于 2024-1-10 08:47 | 显示全部楼层
午夜幽骑王 发表于 2022-2-8 14:33
正琢磨弄一个NAS呢,有没有那种,我NAS插两块HC320 8T,系统里显示8T可用,我往里存东西的时候会同时存到两 ...

这个好像是热备模式,我用的联想个人云X1,5盘位(4+1),第五个盘可以这样设置
发表于 2024-1-10 08:32 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
发表于 2024-1-10 08:15 来自手机 | 显示全部楼层
someone668 发表于 2024-1-10 02:54
每次见到这种问题就头疼,好好说说RAID吧,不是IT大佬,请轻喷
RAID0=要速度啊,那时候没有U2,没有SSD。2 ...

正解,技术有个迭代的过程,按需采用即可。
发表于 2024-1-10 08:14 来自手机 | 显示全部楼层
勇少 发表于 2024-1-9 12:36
带0都容易暴毙。。。

raid10有话要说
发表于 2024-1-10 02:54 | 显示全部楼层
每次见到这种问题就头疼,好好说说RAID吧,不是IT大佬,请轻喷
RAID0=要速度啊,那时候没有U2,没有SSD。2盘R0 4盘R0,速度为王,(轻喷没啥企业应用的,个人应用视频剪辑,导入个工程)
RAID1=要安全啊,不说了
后来发展RAID10 安全速度都要,一看。。。冗余50%,硬件成本太高了,10起步4块硬盘,投资100%,容量50%
然后聪明的人类就弄出来RAID5,顺序的整出来RIAD6了,后来进一步扩展到RIAD50 RAID60
发表于 2024-1-9 14:49 来自手机 | 显示全部楼层
支持lz,家用情况硬盘是有限的,而组raid需要额外的硬盘,不如单盘使用,把额外的硬盘用来备份重要数据。
发表于 2024-1-9 14:00 | 显示全部楼层
huihuige 发表于 2024-1-9 13:54
借楼问下
您用的这个Lsi的软件
准确名称叫什么?或者有下载链接么?

lsi msm
MegaRAID Storage Manager
发表于 2024-1-9 13:54 | 显示全部楼层
zealotxx 发表于 2022-2-24 09:57
win,安装lsi的软件,有io错误会直接弹窗,严重错误才踢盘
可以在网络可达的任何位置,通过ip连上那台机
...

借楼问下
您用的这个Lsi的软件
准确名称叫什么?或者有下载链接么?
他报错是io错误会提示么?
同样的功能硬盘哨兵能替代么?
发表于 2024-1-9 12:41 | 显示全部楼层
本帖最后由 nlnjnj 于 2024-1-9 12:42 编辑

前几天就遇到 阵列控制器坏了一个了 固件更新还不能单独进行 否则2个控制器还有同步问题

无论阵列怎么样 总有不可控的故障点
发表于 2024-1-9 12:36 | 显示全部楼层

带0都容易暴毙。。。
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-7-1 18:17 , Processed in 0.014688 second(s), 8 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表