4 日志收集
Netscaler发生故障后,需要现场工程师收集相关的日志,针对故障的表现方式不同,日志收集方式也不同。
4.1 Netscaler无响应(假死)
Netscaler无响应(假死)是指通过Web、Console口、串口均无法登陆Netscaler设备,现象如下:
客户机与服务器不再有穿越流量 SSH登陆无效 GUI登陆无效 控制台无响应 LED无显示
此时Netscaler已经没有办法通过程序上进行控制和修复,只能进行重启。在使用过程中,Netscaler确实会出现假死情况。
为了便于分析假死原因,我们要求Netscaler设备在假死状态下强制生成 core dump文件并重启。通过按住Netscaler设备面板上的NMI键[1]可以使假死的Netscaler生成 core dump文件并重启。
注: 1、 2、 3、
请确保所有操作无效,再按下NMI键。如果任一操作仍有效,其他处理方法更优。
NMI键重启会比直接重启耗费更长的时间,该时间有Netscaler设备型号和内存大小决定,时间范围为10~45分钟。
生成的core dump文件存于Netscaler设备的/var/crash目录下,收集该日志需要管理员权限用户登录Netscaler设备进行拷贝。
4.2 Netscaler系统故障或者功能性故障
Netscaler系统故障或者功能性故障定义为:通过Web、Console口、串口的一种或者几种方式可以登录Netscaler设备进行维护和命令的执行,该故障可以是依然存在或者是已经恢复的。
为了便于定位分析原因,需要取得Netscaler所记录的运行日志。取得运行日志的方法为:
【】
1、 通过管理员权限登录Netscaler设备,执行show techsupport命令2:
2、 屏幕回显如下:
注意:
1、 如果功能性故障为硬盘损坏,该日志将不能生成,我们直接走故障恢复流程即可。 2、 如果Netscaler设备是HA部署,我们也需要在另一台设备执行该命令。
3、 文件生成后保存在Netscaler设备的/var/tmp/support目录下,通过FTP软件将日志
文件拷贝到本地,描述一下问题现象以及发生点,发给维护工程师。
4、 Web查看也可保存techsupport日志文件。
成功生产日志文件后,可以点击download下载压缩的日志文件,或者到拷贝图中路径中的文件。
对于netscaler常用的功能特性故障【3】,可以根据以下故障现象进行比对,然后采取相应的措施。 4.2.1 高可用性故障
故障现象:
? HA同步失败
? 双机状态的频繁切换 ? 命令传输失败 采取的措施: 1. 查看HA的双节点配置 Web查看:
命令查看:
2. 查看接口信息 Web查看:
命令查看: