找回密码
 加入我们
搜索
      
查看: 16178|回复: 17

[NAS] 群晖最近两次出现硬盘错误,请教大家到底是什么问题

[复制链接]
发表于 2023-4-20 10:46 | 显示全部楼层 |阅读模式
本帖最后由 tarron 于 2023-4-20 16:35 编辑

设备是1821,目前7块硬盘。1号和2号是酷狼,RAID1。4号至7号都是basic模式下的银河,都是这两年陆续买的,其中7号是20T的国行银河,才买了不到半年。半个月前出现第一次,忽然提示4和7损毁,文件管理器里无法访问4和7硬盘,其它硬盘正常。然后所有套件都无法启动。试图重启或关机,结果系统提示SSD缓存建议分析正在运行,无法关机或重启。最后只能把UPS电源拔了,等电量耗尽强制关机。重启后,所有硬盘正常,没有错误提示,4和7访问也正常。

就这样半个月过去,昨天系统升级了7.1.1-42962 u5(上一次出问题的时候系统是42962 u4)。今天忽然又发现所有套件无法启动,进系统查看,还是4和7出问题,这次不是提示损毁,而是提示无法访问系统分区。但是从文件管理器里可以访问4和7,症状比上次的轻一些。然后重启还是不行,依旧提示SSD缓存建议分析正在运行。按老办法重启后,系统依旧提示4和7无法访问系统分区,让我在存储管理器中修复。按提示修复,几秒就完成了。然后系统就恢复正常了,再也查看不到错误提示。

想问下这到底是怎么回事,是硬盘挂了吗,还是群晖系统的问题。

补充一下,刚查看了存储管理器的日志,今天出的问题没有在日志里有记录,但是上回的问题,系统记录为“硬盘已拔出”。我想知道是不是这两块硬盘的接口接触不良?

001.png

002.png
发表于 2023-4-20 11:02 | 显示全部楼层
群晖220+,单盘3T,放在盘1位置做QNAP中重要资料的备份

因为QNAP硬盘故障,导致部分数据转移到群晖时,超出储存空间的设定值报警

随在群晖和QNAP上各挂一个移动硬盘,复制群晖数据做备份,以便更换大容量硬盘

因为路由器设置的每天自动重启,加上大量图片类小文件传输率低,导致群晖向本机移动硬盘和QNAP 移动硬盘的数据复制出错

随即群晖就提示 存储池损毁,系统界面 提示存储池损毁,硬盘状态正常,只读状态

系统日志里,在文件复制出错时段,有两次 硬盘 I/O错误的提示,之后显示 UNC错误,随即存储池损毁

使用 SMART 快速和常规测试均正常,添加的内存,也连续两次内存测试通过,判定硬件无问题

在系统内手动恢复磁盘状态为读写

删除回收站释放部分空间后,出错提示全部消失,恢复正常,供参考
 楼主| 发表于 2023-4-20 11:15 | 显示全部楼层
mark0518 发表于 2023-4-20 11:02
群晖220+,单盘3T,放在盘1位置做QNAP中重要资料的备份

因为QNAP硬盘故障,导致部分数据转移到群晖时,超 ...

是不是群晖系统太敏感了?如果真是硬盘故障,不应该重启后故障就没有了呀。还有就是,如果一块硬盘空间占用率长期都在99%这样,会容易出问题吗?我这次出问题的4号硬盘是占用99%,但是7号硬盘还有10T的空间没用啊。
发表于 2023-4-20 11:54 | 显示全部楼层
白裙不是有技术支持吗?何必在这里问呢
发表于 2023-4-20 12:06 | 显示全部楼层
tarron 发表于 2023-4-20 11:15
是不是群晖系统太敏感了?如果真是硬盘故障,不应该重启后故障就没有了呀。还有就是,如果一块硬盘空间占 ...

没有重启,系统就恢复正常

群晖系统比QNAP 敏感的多

QNAP的硬盘出现C5 数值2,都没有报错,只是硬盘亮红灯,我是发现文件无法读取,才进管理界面发现的

过两天也把工作日志发群晖客服确认下
发表于 2023-4-20 12:09 | 显示全部楼层
我1621,之前用918出现过类似问题,后来用1621的时候索性不组raid了,目前一点事没有,转眼也两年多了吧
发表于 2023-4-20 14:21 | 显示全部楼层
我前两天一个盘UNC报错,硬盘只读,然后存储池损毁。原因也是写入时出错。
然后导出数据,删除存储池,重新插上盘,又正常了。看smart,C5直接从0飙到320。我猜是有坏块了。

 楼主| 发表于 2023-4-23 12:52 | 显示全部楼层
dedededede 发表于 2023-4-20 11:54
白裙不是有技术支持吗?何必在这里问呢

我都懒得问技术支持。但我还是问了,得到了如下答复:检测到您使用的硬盘不在我们的兼容性列表里,检测到您用了第三方的内存。。。

你还想问技术支持吗
发表于 2023-4-24 09:56 | 显示全部楼层
本帖最后由 刹之那 于 2023-4-24 09:57 编辑
tarron 发表于 2023-4-23 12:52
我都懒得问技术支持。但我还是问了,得到了如下答复:检测到您使用的硬盘不在我们的兼容性列表里,检测到 ...


群晖客服你用的非兼容列表内的东西他就这样的,淡定。

不过以前群晖客服不是,至少去年还不是,我用了一堆非列表硬盘和内存,都给我弄了,帮我远程救回了一堆数据。但是今年发现只要是非兼容的,他就不理你了,可能是工程师也被优化了一大部分,没钱发工资了
发表于 2023-4-24 20:33 | 显示全部楼层
uprit 发表于 2023-4-20 14:21
我前两天一个盘UNC报错,硬盘只读,然后存储池损毁。原因也是写入时出错。
然后导出数据,删除存储池,重新 ...

我的症状第一行和你一样

区别是我当时从220+中向本机挂载的移动硬盘以及局域网中的另一台QNAP copy数据,路由器定时重启了

所以报I/O 和UNC 错误

用220+全面检测smart后,无问题
发表于 2023-9-15 11:08 | 显示全部楼层
我去 自从我黑群6.23升级到7.2以后 ,就没消停过,不是1234坏,就是6789坏,
重启又好了,smart 有的能跑有的不能跑,,我怀疑是群晖为了卖硬盘,调高了某些报警参数导致的.
看smart 都正常,我8块硬盘2块机械,6块ssd,三星863 863A 东芝HK4R.
发表于 2023-9-15 12:26 来自手机 | 显示全部楼层
tarron 发表于 2023-4-23 12:52
我都懒得问技术支持。但我还是问了,得到了如下答复:检测到您使用的硬盘不在我们的兼容性列表里,检测到 ...

至少没说,“你稍等啊,我登上来帮你看一下”
发表于 2023-9-15 12:27 来自手机 | 显示全部楼层
mark0518 发表于 2023-4-24 20:33
我的症状第一行和你一样

区别是我当时从220+中向本机挂载的移动硬盘以及局域网中的另一台QNAP copy数据 ...

可能是IO超时就报错了
发表于 2023-9-29 23:15 | 显示全部楼层
这个我也遇到过DS98+,希捷银河8TB氦气+HGST He10 8TB氦气(WD HC510)组Raid 1,希捷的银河8TB氦气报损毁,同时购买的HGST He10 8TB没问题,换下银河DG慢扫全绿,但是重新插上群晖就报损毁
我个人认为能用WD就不要用希捷了,我用希捷的硬盘在群晖上面坏过2块硬盘,一块是上面的银河,一块是更早的2TB的希捷酷狼
现在4块硬盘都是WD HC550 18TB
发表于 2023-9-29 23:44 | 显示全部楼层
我为了安全,全部raid 1...还是不同品牌的磁盘组的,就怕同品牌有相同问题全噶了
发表于 2023-9-30 00:42 来自手机 | 显示全部楼层
刹之那 发表于 2023-4-24 09:56
群晖客服你用的非兼容列表内的东西他就这样的,淡定。

不过以前群晖客服不是,至少去年还不是,我用了一 ...

这个其实也是正常的,人家没测试过的东西,让人家怎么回答?
发表于 2023-9-30 11:09 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
发表于 2023-9-30 13:20 | 显示全部楼层
都c5了,就是盘炸了。慢扫试试。有坏道就换盘吧
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-4-28 17:36 , Processed in 0.011328 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表