tarron 发表于 2023-4-20 10:46

群晖最近两次出现硬盘错误,请教大家到底是什么问题

本帖最后由 tarron 于 2023-4-20 16:35 编辑

设备是1821,目前7块硬盘。1号和2号是酷狼,RAID1。4号至7号都是basic模式下的银河,都是这两年陆续买的,其中7号是20T的国行银河,才买了不到半年。半个月前出现第一次,忽然提示4和7损毁,文件管理器里无法访问4和7硬盘,其它硬盘正常。然后所有套件都无法启动。试图重启或关机,结果系统提示SSD缓存建议分析正在运行,无法关机或重启。最后只能把UPS电源拔了,等电量耗尽强制关机。重启后,所有硬盘正常,没有错误提示,4和7访问也正常。

就这样半个月过去,昨天系统升级了7.1.1-42962 u5(上一次出问题的时候系统是42962 u4)。今天忽然又发现所有套件无法启动,进系统查看,还是4和7出问题,这次不是提示损毁,而是提示无法访问系统分区。但是从文件管理器里可以访问4和7,症状比上次的轻一些。然后重启还是不行,依旧提示SSD缓存建议分析正在运行。按老办法重启后,系统依旧提示4和7无法访问系统分区,让我在存储管理器中修复。按提示修复,几秒就完成了。然后系统就恢复正常了,再也查看不到错误提示。

想问下这到底是怎么回事,是硬盘挂了吗,还是群晖系统的问题。

补充一下,刚查看了存储管理器的日志,今天出的问题没有在日志里有记录,但是上回的问题,系统记录为“硬盘已拔出”。我想知道是不是这两块硬盘的接口接触不良?



mark0518 发表于 2023-4-20 11:02

群晖220+,单盘3T,放在盘1位置做QNAP中重要资料的备份

因为QNAP硬盘故障,导致部分数据转移到群晖时,超出储存空间的设定值报警

随在群晖和QNAP上各挂一个移动硬盘,复制群晖数据做备份,以便更换大容量硬盘

因为路由器设置的每天自动重启,加上大量图片类小文件传输率低,导致群晖向本机移动硬盘和QNAP 移动硬盘的数据复制出错

随即群晖就提示 存储池损毁,系统界面 提示存储池损毁,硬盘状态正常,只读状态

系统日志里,在文件复制出错时段,有两次 硬盘 I/O错误的提示,之后显示 UNC错误,随即存储池损毁

使用 SMART 快速和常规测试均正常,添加的内存,也连续两次内存测试通过,判定硬件无问题

在系统内手动恢复磁盘状态为读写

删除回收站释放部分空间后,出错提示全部消失,恢复正常,供参考

tarron 发表于 2023-4-20 11:15

mark0518 发表于 2023-4-20 11:02
群晖220+,单盘3T,放在盘1位置做QNAP中重要资料的备份

因为QNAP硬盘故障,导致部分数据转移到群晖时,超 ...

是不是群晖系统太敏感了?如果真是硬盘故障,不应该重启后故障就没有了呀。还有就是,如果一块硬盘空间占用率长期都在99%这样,会容易出问题吗?我这次出问题的4号硬盘是占用99%,但是7号硬盘还有10T的空间没用啊。

dedededede 发表于 2023-4-20 11:54

白裙不是有技术支持吗?何必在这里问呢

mark0518 发表于 2023-4-20 12:06

tarron 发表于 2023-4-20 11:15
是不是群晖系统太敏感了?如果真是硬盘故障,不应该重启后故障就没有了呀。还有就是,如果一块硬盘空间占 ...

没有重启,系统就恢复正常

群晖系统比QNAP 敏感的多

QNAP的硬盘出现C5 数值2,都没有报错,只是硬盘亮红灯,我是发现文件无法读取,才进管理界面发现的

过两天也把工作日志发群晖客服确认下

winc4532 发表于 2023-4-20 12:09

我1621,之前用918出现过类似问题,后来用1621的时候索性不组raid了,目前一点事没有,转眼也两年多了吧

uprit 发表于 2023-4-20 14:21

我前两天一个盘UNC报错,硬盘只读,然后存储池损毁。原因也是写入时出错。
然后导出数据,删除存储池,重新插上盘,又正常了。看smart,C5直接从0飙到320。我猜是有坏块了。

tarron 发表于 2023-4-23 12:52

dedededede 发表于 2023-4-20 11:54
白裙不是有技术支持吗?何必在这里问呢

我都懒得问技术支持。但我还是问了,得到了如下答复:检测到您使用的硬盘不在我们的兼容性列表里,检测到您用了第三方的内存。。。

你还想问技术支持吗[生病]

刹之那 发表于 2023-4-24 09:56

本帖最后由 刹之那 于 2023-4-24 09:57 编辑

tarron 发表于 2023-4-23 12:52
我都懒得问技术支持。但我还是问了,得到了如下答复:检测到您使用的硬盘不在我们的兼容性列表里,检测到 ...

群晖客服你用的非兼容列表内的东西他就这样的,淡定。

不过以前群晖客服不是,至少去年还不是,我用了一堆非列表硬盘和内存,都给我弄了,帮我远程救回了一堆数据。但是今年发现只要是非兼容的,他就不理你了,可能是工程师也被优化了一大部分,没钱发工资了[偷笑] 。

mark0518 发表于 2023-4-24 20:33

uprit 发表于 2023-4-20 14:21
我前两天一个盘UNC报错,硬盘只读,然后存储池损毁。原因也是写入时出错。
然后导出数据,删除存储池,重新 ...

我的症状第一行和你一样

区别是我当时从220+中向本机挂载的移动硬盘以及局域网中的另一台QNAP copy数据,路由器定时重启了

所以报I/O 和UNC 错误

用220+全面检测smart后,无问题

hbmask 发表于 2023-9-15 11:08

我去 自从我黑群6.23升级到7.2以后 ,就没消停过,不是1234坏,就是6789坏,
重启又好了,smart 有的能跑有的不能跑,,我怀疑是群晖为了卖硬盘,调高了某些报警参数导致的.
看smart 都正常,我8块硬盘2块机械,6块ssd,三星863 863A 东芝HK4R.

RyanLR 发表于 2023-9-15 12:26

tarron 发表于 2023-4-23 12:52
我都懒得问技术支持。但我还是问了,得到了如下答复:检测到您使用的硬盘不在我们的兼容性列表里,检测到 ...

至少没说,“你稍等啊,我登上来帮你看一下”

RyanLR 发表于 2023-9-15 12:27

mark0518 发表于 2023-4-24 20:33
我的症状第一行和你一样

区别是我当时从220+中向本机挂载的移动硬盘以及局域网中的另一台QNAP copy数据 ...

可能是IO超时就报错了

CyrixIII 发表于 2023-9-29 23:15

这个我也遇到过DS98+,希捷银河8TB氦气+HGST He10 8TB氦气(WD HC510)组Raid 1,希捷的银河8TB氦气报损毁,同时购买的HGST He10 8TB没问题,换下银河DG慢扫全绿,但是重新插上群晖就报损毁
我个人认为能用WD就不要用希捷了,我用希捷的硬盘在群晖上面坏过2块硬盘,一块是上面的银河,一块是更早的2TB的希捷酷狼
现在4块硬盘都是WD HC550 18TB

bgnh 发表于 2023-9-29 23:44

我为了安全,全部raid 1...还是不同品牌的磁盘组的,就怕同品牌有相同问题全噶了

雨季不再来 发表于 2023-9-30 00:42

刹之那 发表于 2023-4-24 09:56
群晖客服你用的非兼容列表内的东西他就这样的,淡定。

不过以前群晖客服不是,至少去年还不是,我用了一 ...

这个其实也是正常的,人家没测试过的东西,让人家怎么回答?

tedsun 发表于 2023-9-30 11:09

鱼鱼鱼1 发表于 2023-9-30 13:20

都c5了,就是盘炸了。慢扫试试。有坏道就换盘吧https://cdn.jsdelivr.net/gh/master-of-forums/master-of-forums/public/images/patch.gif
页: [1]
查看完整版本: 群晖最近两次出现硬盘错误,请教大家到底是什么问题