找回密码
 加入我们
搜索
      
查看: 5145|回复: 11

[NAS] 【UPS】NUT与APC BR1000G配合上的一个特殊故障

[复制链接]
发表于 2023-8-1 15:30 | 显示全部楼层 |阅读模式
本帖最后由 mshtyu 于 2023-8-1 15:33 编辑

以前用的APC BK650,一直好好的保护着我的NAS,随着需要保护的设备越来越多,一年半前换成了更大负载能力的APC BR1000G,带450W负载可以撑12分钟左右,足够死慢死慢的QNAP关机的时间了。一年半左右表现正常,断电保护过几次。但最近一次夏天的夜间停电,诱发了NUT软件与这款(不知道还有没有其他款)UPS间的一个Bug,且导致了NAS的数据损毁、PVE主机和虚拟机的硬盘数据错误,很多NAS系统都是用NUT管理UPS的,请使用这款UPS配合NAS的朋友们关注。

诱发条件:停电时间比较久,UPS电池耗尽;
故障情况:达成诱发条件,市电恢复正常后,连接着UPS的主机启动后,只要NUT组件服务启动,不知道是driver的问题,还是nut-server的问题,UPS突然失去市电转由电池供电(此时市电是正常的),由于之前电池已经耗尽,所以这次供电会导致正在启动和运行中的被保护系统异常断电;
影响的系统:PVE7.3、debian11、群晖6.2.3、Qnap 5.x;以上几个系统用的都是“较老”版本的NUT,都会出现这个故障,PVE上可以apt安装的最新版本是2.7.4,也是故障版本;群晖和qnap直接连UPS,在同样诱发条件下,也会出现该故障;


经与APC客服和NUT开发团队之间的沟通和反复测试,确认系NUT的bug,因为无论使用apcupsd还是power chute,都不会有问题;NUT开发团队不打算改这个版本,推荐我编译新版本使用,我懒得弄debian、synology、qnap那么多系统上的NUT了。

最后换成了PVE上安装 apcupsd 规避这个Bug,这个软件虽然更老,但是确实没有这个问题;然后在另一台虚拟debian上装NUT server,驱动设置成PVE主机上的apcupsd,然后其他机器设置这台debian上的网络UPS主机。为什么是另一台?无语的很,nut和apcupsd在debian的安装包是互斥的,安装了这个会删掉另一个。有个国外的大兄弟写了个nutwrapper的脚本解决,但是不支持TSL协议,基本也就不能用了,给他报个issue,他也只是说知道了……

最后夸一下狗东和APC,一年半,还在保质期内,立马换新的,但是新的也是这个问题,APC的工程师小哥还是挺好的。

附:debian上的nut server配置  ups.conf

[qnapups]
        driver = apcupsd-ups
        port = 192.168.0.254:3551 # 指向 PVE主机的apcupsd的端口
        desc = "BR1000G"

评分

参与人数 1邪恶指数 +6 收起 理由
uuyyhhjj + 6 666

查看全部评分

发表于 2023-8-1 15:51 | 显示全部楼层
我的winserver用的powerchute
 楼主| 发表于 2023-8-1 15:56 | 显示全部楼层
uuyyhhjj 发表于 2023-8-1 15:51
我的winserver用的powerchute

对,APC自家软件不会有问题,APC客服小哥就是用这个打败我的,庆幸的是狗东给换新,不幸的是新的电池带载时有噪音~
发表于 2023-8-1 16:46 | 显示全部楼层
据说apcupsd和BK650M2-CH,也就是带CH字样的UPS,是有问题的,主要是状态不一致。这么搞的话,楼主测试了没?话说测试是怎么测试,直接断电测试?万一不成岂不尴尬- -
 楼主| 发表于 2023-8-1 16:54 | 显示全部楼层
gfhgth 发表于 2023-8-1 16:46
据说apcupsd和BK650M2-CH,也就是带CH字样的UPS,是有问题的,主要是状态不一致。这么搞的话,楼主测试了没 ...

看到过这样的帖子,我没有这个型号,只有老款的那个,没出过问题;测试就是换各种软件搭后断市电,我用了个智能插座来切换的,几轮测试下来,nas肯定是要坏数据的……好在我数据有备份,也修复了。

尴尬肯定尴尬,但是不知道这个问题,nas就危险了。
发表于 2023-8-1 17:00 | 显示全部楼层
mshtyu 发表于 2023-8-1 16:54
看到过这样的帖子,我没有这个型号,只有老款的那个,没出过问题;测试就是换各种软件搭后断市电,我用了 ...

你是nas两台,pve一台,3台物理机?这么夸张的吗
 楼主| 发表于 2023-8-1 17:42 | 显示全部楼层
gfhgth 发表于 2023-8-1 17:00
你是nas两台,pve一台,3台物理机?这么夸张的吗

不夸张吧,还有几台服务器,平时不咋开,
发表于 2023-8-1 17:47 来自手机 | 显示全部楼层
mshtyu 发表于 2023-8-1 15:56
对,APC自家软件不会有问题,APC客服小哥就是用这个打败我的,庆幸的是狗东给换新,不幸的是新的电池带载 ...

还能没噪音?我的就是因为只要插电就有类似电感的声音没用几次就扔了
发表于 2023-8-1 17:55 | 显示全部楼层
哎 我说真的  看了这么多的NAS   数据保存 真尼玛矫情  这也有问题  那也有问题   还不如直接买硬盘放电脑上面 算求了   
发表于 2023-8-1 18:34 | 显示全部楼层
看到这贴突然发现我unraid版本升级后,ups服务自动关了。还好最近没停电,赶紧打开。
发表于 2023-8-1 21:20 | 显示全部楼层
UNRAID配的BK650 设置的电池50%自动关机 关机等待阵列60S
几次停电也没啥问题
感谢楼主分享
发表于 2023-8-6 10:33 | 显示全部楼层
这件事情让我对APC非常不满,但是,行内并没有更好的厂家(家用)。

亲测,BR550也这个德行的,应该是这个系列的固件出了问题,毕竟,大家都重启,但是UPS主控是不重启的。

这种细分市场真是躺平,这么多年没什么升级做出来...
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-4-26 18:14 , Processed in 0.010935 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表