找回密码
 加入我们
搜索
      
查看: 568|回复: 12

[NAS] 遇到一个很奇怪的问题,关于戴尔R730xd自动重启的问题,求高高手帮助

[复制链接]
发表于 2025-10-13 12:00 | 显示全部楼层 |阅读模式
事情简略经过:
我在戴尔R730xd中安装的ESXI 7.0 U3系统,一直长期稳定使用了,中间也就是系统启动优盘坏过重装过,从以前的6.3到现在的7.0都很稳定,但是在今年7月份出现了esxi自动重启的情况,并且重启时间很固定,都是在零点多,但是重启日期不固定。通过ping戴尔的iDRAC和ESXI我发现重启的时候戴尔的iDRAC并不会断,所以说是服务器没有断电重启,只是系统重启了。

排查过程
在第一次出现重启的时候我印象中前段时间动了esxi的ntp时间同步设置,所以在后边又重启了几次后我重装了esxi系统,所使用的系统映像和之前一样(出现本问题前已经稳定运行超过一年),但是重装系统无效,我通过ai查询判断是戴尔的iDRAC中的作业队列有问题,我看了下确实有两条Reboot: Graceful oS shutdown withpowercycle on timeout条目i,然后我就把所有的作业队列都删了,但是问题依然出现。
中间我还折腾了iDRAC和ESXI的时间同步以及市区设置,依然无法解决问题。

在9月底的时候我又抽时间查了一下,通过ai搜索说是戴尔的r730xd的BIOS存在时间同步BUG,所以我就把bios从2.17升级到了2.19(戴尔官网找到的最新的,ai说最新的是2.20),顺便也把IDRAC升级到了最新的2.86.86.86.本以为问题得到了解决,但是在升级过bios的半个月后又出现了自动重启,并且时间依然固定,都是不定日期的固定凌晨3点,区别是我设置时区前是凌晨0点左右变化为现在的凌晨3点左右。

==============================================================================

以前遗留的作业队列,现在已经全部删除了
作业队列.png

出现重启后ESXI的系统日志,作用不大,因为重装了esxi故障依旧
ESXI重启日志信息.png

在出现重启时候的iDRAC系统日志
IDRAC重启日志信息.png

近期的重启记录
IDRAC重启日志统计.png

=================================================================================

这个问题快把我折磨疯了,关键是每次重启都太伤硬盘了,我上面插着100T的存储啊,求大佬们帮助分析判断问题所在,跪谢
发表于 2025-10-13 14:02 | 显示全部楼层
是不是太老了?硬件不太稳定,需要换新的了?
发表于 2025-10-13 15:32 | 显示全部楼层
重置一下idrac试试
 楼主| 发表于 2025-10-13 16:34 | 显示全部楼层

请问要如何操作?
发表于 2025-10-13 16:38 | 显示全部楼层
是dell专用版的esxi吗,我是720xd在用esxi,连续很稳定,再就是你电源用的多少瓦,会不会是电源不稳定啥的
发表于 2025-10-13 16:41 | 显示全部楼层
你这是主动动作啊,system is turning off,有脚本?
 楼主| 发表于 2025-10-13 16:54 | 显示全部楼层
回复5楼@gaoyi124,6楼@edgeskypay

是戴尔官网下载的R730xd专用的ESXI系统版本,双电源带ups(没插管理线),看了IDRAC上的供电记录,没有异常

我没有设置任何脚本,我也不知道在哪里设置脚本,这台机器在我机柜里快3年了,一直正常,在出现问题前至少一年没有去动过设置,除了调整风扇转速,期间没改过任何其他设置
发表于 2025-10-13 17:33 | 显示全部楼层
l8017379 发表于 2025-10-13 16:34
请问要如何操作?

重启服务器,按F2,第2个项目就是idrac,进去,重置在最后或者倒数第二个选项,重置完需要重新配置idrac的IP和密码
 楼主| 发表于 2025-10-13 17:37 | 显示全部楼层
x95extreme 发表于 2025-10-13 17:33
重启服务器,按F2,第2个项目就是idrac,进去,重置在最后或者倒数第二个选项,重置完需要重新配置idrac ...

好的,我试一下,谢谢大佬回复
发表于 2025-10-13 18:16 | 显示全部楼层
会不会是UPS问题?发出了关机指令了?
半夜停电了,ups通知关机,来电了,来电自启动?
发表于 2025-10-14 09:32 | 显示全部楼层
1、换个系统试试还会不会重启。
2、会不会是机器太热了,公司的云服务器有过冷通道过热导致服务器过热重启的案例
发表于 2025-10-14 11:52 | 显示全部楼层

System is turning On
System CPU Resetinig
System is Turning off

10-13 3点03分的IDRAC 日志是标准重启流程,一般是由操作系统发起的操作请求。
IDRAC 硬件栏里面,要确保电池风扇CPU内存等等每一项都是绿色的
 楼主| 发表于 2025-10-14 12:11 | 显示全部楼层
感谢10楼11楼12楼大佬们回复,

ups的控制线是在另一台机器上插着的,我查看了没有断电记录

服务器风扇转速40%,cpu温度60度,机箱温度也正常。

12楼兄弟说的这个,我昨晚先是用idrac测试了一下硬件,报了几个错,分别是网卡驱动版本低,风扇4传感器错误(风扇转速正常,也可以正常查看调节转速),日志包含失败记录。其他的硬盘内存 cpu都是正常的,然后我按照8楼兄弟的指导把IDRAC给重置了,重置后用新ip登录只是改了一下ip,其他设置都没动。
如果是系统的问题的话我已经给esxi重装过了,用的映像文件是戴尔官方下载的,而且之前也稳定运行超过一年以上
现在先等在观察几天看看吧

谢谢各位大佬们的回复
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-10-14 17:42 , Processed in 0.009316 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表