记一次Huawei2288hv5的ESXI死机处理经过

今天公司的一些服务突然无法访问,后来一看这些服务都是同一台ESXI上的虚拟机,于是猜测可能是ESXI设备的网断了,要么就是整个机器死机了。这里记录一下故障排查到恢复的过程。

系统组成

  • 一台物理服务器,华为2288hv5
  • 服务器装的ESXI6.7

关于这台服务器ESXI的安装可以参考我的另外几篇博客

故障表现

故障表现为所有虚拟机无法ping通,ESXI管理口无法ping通,只有华为服务器的iBMC硬件管理口是通的。华为2288hv5型号服务器后面有3个网口,一个为管理口,两个为业务口。目前看管理口是好的,业务口不可访问。

故障排查

首先看看是不是因为网线松了导致业务口不可达

经过检查服务器后面的3个网口的灯都是亮的,说明核心交换机到服务器的线路没问题了,如下

1-network.jpg

进入iBMC查看ESXI状态

通常来说只要服务器没有断电,而且网线是通的,管理口不太可能莫名其妙挂掉,这里的表现也是。那就登录iBMC查看下。

2-ibmc.png

并没有任何告警出来,于是来到远程控制,进入HTML5集成远程控制台,进入之前安装ESXI操作系统后的界面,如下

3-f2.png

在这里按下F2,输入ESXI用户名和密码,尝试进入ESXI,发现可以进入

4-test.png

利用键盘移动光标到图上的Test Management Network,测试一下ESXI管理口的连通性,发现ESXI管理口连网关都ping不到,基本可以认定是ESXI系统死了。

移动光标到Restart Management Network处,按回车重启下管理口,之后发现ESXI管理口可以被访问了

5-restart_management.png

进入ESXI管理页面,直接进入网络页面,发现两个物理网卡连接是好的

6-esxi_network.png

尝试进入每个虚拟机,奇怪了,每个虚拟机都有反应,但是ip就是ping不到。最后没办法,把虚拟机的一些文件保存好,关机,准备重启ESXI系统

在下面这个界面按F12重启ESXI

7-f12.png

输入用户名和密码,之后在下面的界面按F11确认重启

8-f11.png

重启完,回到如下界面

9-finish_reboot.png

再次从ESXI管理界面进入,发现所有的虚拟机都处于关机状态。批量选中重启机器,之后发现所有的ip又都可以ping到了。

这里有几点需要特别强调一下

  • 我这里的虚拟机都是用的固定ip,而不是DHCP。如果采用DHCP,机器ip可能会变,要小心
  • 机器重启后,需要检查下服务器内的服务,如果没有设定为开机自启动需要手动启动,不然服务还是不可用

我是T型人小付,一位坚持终身学习的互联网从业者。喜欢我的博客欢迎在csdn上关注我,如果有问题欢迎在底下的评论区交流,谢谢。