【UPS】NUT与APC BR1000G配合上的一个特殊故障
本帖最后由 mshtyu 于 2023-8-1 15:33 编辑以前用的APC BK650,一直好好的保护着我的NAS,随着需要保护的设备越来越多,一年半前换成了更大负载能力的APC BR1000G,带450W负载可以撑12分钟左右,足够死慢死慢的QNAP关机的时间了。一年半左右表现正常,断电保护过几次。但最近一次夏天的夜间停电,诱发了NUT软件与这款(不知道还有没有其他款)UPS间的一个Bug,且导致了NAS的数据损毁、PVE主机和虚拟机的硬盘数据错误,很多NAS系统都是用NUT管理UPS的,请使用这款UPS配合NAS的朋友们关注。
诱发条件:停电时间比较久,UPS电池耗尽;
故障情况:达成诱发条件,市电恢复正常后,连接着UPS的主机启动后,只要NUT组件服务启动,不知道是driver的问题,还是nut-server的问题,UPS突然失去市电转由电池供电(此时市电是正常的),由于之前电池已经耗尽,所以这次供电会导致正在启动和运行中的被保护系统异常断电;
影响的系统:PVE7.3、debian11、群晖6.2.3、Qnap 5.x;以上几个系统用的都是“较老”版本的NUT,都会出现这个故障,PVE上可以apt安装的最新版本是2.7.4,也是故障版本;群晖和qnap直接连UPS,在同样诱发条件下,也会出现该故障;
经与APC客服和NUT开发团队之间的沟通和反复测试,确认系NUT的bug,因为无论使用apcupsd还是power chute,都不会有问题;NUT开发团队不打算改这个版本,推荐我编译新版本使用,我懒得弄debian、synology、qnap那么多系统上的NUT了。
最后换成了PVE上安装 apcupsd 规避这个Bug,这个软件虽然更老,但是确实没有这个问题;然后在另一台虚拟debian上装NUT server,驱动设置成PVE主机上的apcupsd,然后其他机器设置这台debian上的网络UPS主机。为什么是另一台?无语的很,nut和apcupsd在debian的安装包是互斥的,安装了这个会删掉另一个。有个国外的大兄弟写了个nutwrapper的脚本解决,但是不支持TSL协议,基本也就不能用了,给他报个issue,他也只是说知道了……
最后夸一下狗东和APC,一年半,还在保质期内,立马换新的,但是新的也是这个问题,APC的工程师小哥还是挺好的。
附:debian上的nut server配置ups.conf
driver = apcupsd-ups
port = 192.168.0.254:3551 # 指向 PVE主机的apcupsd的端口
desc = "BR1000G"
我的winserver用的powerchute uuyyhhjj 发表于 2023-8-1 15:51
我的winserver用的powerchute
对,APC自家软件不会有问题,APC客服小哥就是用这个打败我的,庆幸的是狗东给换新,不幸的是新的电池带载时有噪音~ [无奈] 据说apcupsd和BK650M2-CH,也就是带CH字样的UPS,是有问题的,主要是状态不一致。这么搞的话,楼主测试了没?话说测试是怎么测试,直接断电测试?万一不成岂不尴尬- - gfhgth 发表于 2023-8-1 16:46
据说apcupsd和BK650M2-CH,也就是带CH字样的UPS,是有问题的,主要是状态不一致。这么搞的话,楼主测试了没 ...
看到过这样的帖子,我没有这个型号,只有老款的那个,没出过问题;测试就是换各种软件搭后断市电,我用了个智能插座来切换的,几轮测试下来,nas肯定是要坏数据的……好在我数据有备份,也修复了。
尴尬肯定尴尬,但是不知道这个问题,nas就危险了。 mshtyu 发表于 2023-8-1 16:54
看到过这样的帖子,我没有这个型号,只有老款的那个,没出过问题;测试就是换各种软件搭后断市电,我用了 ...
你是nas两台,pve一台,3台物理机?这么夸张的吗 gfhgth 发表于 2023-8-1 17:00
你是nas两台,pve一台,3台物理机?这么夸张的吗
不夸张吧,还有几台服务器,平时不咋开,[怪脸]
mshtyu 发表于 2023-8-1 15:56
对,APC自家软件不会有问题,APC客服小哥就是用这个打败我的,庆幸的是狗东给换新,不幸的是新的电池带载 ...
还能没噪音?我的就是因为只要插电就有类似电感的声音没用几次就扔了 哎 我说真的看了这么多的NAS 数据保存 真尼玛矫情这也有问题那也有问题 还不如直接买硬盘放电脑上面 算求了 看到这贴突然发现我unraid版本升级后,ups服务自动关了。还好最近没停电,赶紧打开。 UNRAID配的BK650 设置的电池50%自动关机 关机等待阵列60S
几次停电也没啥问题
感谢楼主分享 这件事情让我对APC非常不满,但是,行内并没有更好的厂家(家用)。
亲测,BR550也这个德行的,应该是这个系列的固件出了问题,毕竟,大家都重启,但是UPS主控是不重启的。
这种细分市场真是躺平,这么多年没什么升级做出来...
页:
[1]