IBM服务器素来以稳定著称,但有时候难免也会出现一些故障。在出现故障时怎么排除故障,除了依靠经验判断定位故障外,还有没有更好的办法呢?
IBM X系列服务器提供了Integrated Management Module(IMM)集成管理模块,可以比较方便的监控服务器健康状况,查看日志信息,还提供了一些配置管理功能。下面就让我们来看看这个神秘的IMM吧。
首先要查看此网口的IP地址是否是192.168.70.125,可进入服务器BIOS选项查看,如IP不是192.168.70.125.可将其更改,具体信息如下:开机按F1进入BIOS选项菜单,选择“System Settings”进入该菜单设置;进入“System Settings”菜单选项后选择“Integrated Management Module”菜单;进入“Integrated Management Module”菜单,选择“Network Configuration”菜单;进入“Network Configuration”查看IP是否是192.168.70.125,如否,将其更改为此IP并选择“Save Network Settings”将设置保存。
在IBM X系列服务器背板上有一个“SYS MGMT”接口,用网线将此接口与笔记本连接起来,然后将笔记本的IP地址配置成“192.168.70.0/24”这个网段的地址,然后PING测试“192.168.70.125”,如果能通就OK了。IMM的默认管理地址就是“192.168.70.125/24”,此地址可以进行修改。然后在IE地址栏输入“http://192.168.70.125”,然后出来登录界面。输入用户名口令:USERID/PASSW0RD,注意是数字“0”不是英文字母“o”。点“continue”" _src="http://192.168.70.125”,然后出来登录界面。输入用户名口令:USERID/PASSW0RD,注意是数字“0”不是英文字母“o”。点“continue”">http://192.168.70.125”,然后出来登录界面。输入用户名口令:USERID/PASSW0RD,注意是数字“0”不是英文字母“o”。点“continue”
在“system status”可以查看系统的健康状况,如果系统正常则显示绿色指示灯, 如果有错误则显示xxx灯,并会列出是什么错误。
“vitual light path”指示灯状态。
这里是服务器日志信息模块,记录了错误日志,警告日志和信息日志信息,可以帮助工程师方便的定位故障。
在“network interfaces”里可以对网络接口进行配置,修改管理地址等操作。
在“Login Profiles”导行栏中可以添加管理帐户。
在IBM x3650m3与IBM x3850x5服务器中都曾用IMM日志定位过故障。将一次定位IBMx 3850x5的内存故障定位过程和大家分享一下。
IBMx3850x5首先出现硬件故障时,服务器的关键指示灯面板上会有指示,如果是内存故障,则“MEM”亮黄灯,但当时我们的服务器共有128G内存,有8块内存板,每块内存板上插了4条4G的内存,这么多的内存,如何知道到底是哪条或者哪几条内存出了问题了,常规的做法是插开机箱面板去看内存板卡上的指示灯,这是种方法。而且也可以进行定位,其实还有2种方法,一种是通过BIOS去检查系统信息,里面也会有指示,另一种就是通过IMM,查看日志。我个人偏向于IMM,因为简单直观,还需要指出一点就是IBM x3850x5在内存板卡上插槽的位置有讲究,不是随便插的,每块内存板卡上有8个槽位,插内存条时要成对的插,而且按照1-8,3-6,2-7,4-5的顺序,而且每对内存只要有一根出错,2个槽位会同时报错。