找回密码
 加入我们
搜索
      
查看: 5114|回复: 26

[外设] 有人实现过山特TG-BOX850配置NUT-Server停电时使网络中的多台服务器自动关机吗?

[复制链接]
发表于 2024-5-11 13:04 | 显示全部楼层
本帖最后由 edgeskypay 于 2024-5-11 13:08 编辑

来看看我们是怎么干的。
从前:
ROS->dude->monitor target->触发notifaction动作->run script on server->http(GET/POST)->msg_api(企微、短信、电话、钉钉、webhook)统一接口->落库记录+告警推送+执行动作。

现在:
把ROS的dude换成了prometheus+夜莺,比dude麻烦也重,但是好歹比dude多了个统一管理界面。后端http(GET/POST)到msg_api的逻辑没变。

没变的原因,就是因为记录落库、分类统计、报表等用途,云端推送SDK重封装一下,比直接推出去,好用些。

我们不仅SD-WAN网关用的ping,服务器也用,还监控了服务端口、API的URL、返回JSON值,传参后业务逻辑等。

所以,ping不是野路子我觉得,能解决问题就是好路子。

甚至,某些分公司没有UPS电话告警,只有短信的情况,叫他们做了路由器或者ubuntu的PC丢办公区,常开,如果ping不通,就触发电话告警API去。也用的ping啊。。。

//------------------------------------------------
因为你这不需要发告警出去,所以不用考虑断电以后网络不通,必须走4G发消息的情况。
但是你要考虑的是链路断电,ping网关,有网关断电的情况,交换机断电的情况,网关假死的情况等多种误判,脚本逻辑写if else考虑的全面点。
发表于 2024-5-11 13:09 | 显示全部楼层
kevinho86 发表于 2024-5-11 13:07
楼主觉得“ping是野路子”是因为ping会占用系统资源(按照楼主之前的贴所理解) ...

他写的一台esxi和三台windows,不至于在乎ping的消耗吧
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-9-19 04:53 , Processed in 0.007490 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表