HP UXIX 小型机 维护笔记 下载本文

HP9000系统知识手册

target \

problem or the target agent timing out due to extended inactivity. This target has been automatically excluded from the task and you cannot obtain the Product Summary, Logfile, or Disk. \Action Plan

出错后会回到swinstall 的主菜单相关的patches 仍然被选中重新安装swinstall 应该会正常结束系统重新启动后如果“ swinstall –l patch –a state ”显示相关patch 是“installed”状态而非“configured”则需要使用swconfig 重新配置相关patch 如果以上操作不能解决问题可以尝试下列建议

在swinstall 的命令中带入rpc_timeout=9 的选项该参数的缺省值为5 建议设为9 如 # swinstall -x rpc_timeout=9 -s :/dev/rmt/0m

注意要使rpc_timeout 生效rpc_retry_interval 应为一非0 的值 53、FC60 电池更换 适用机型

HP 9000 SERVER 实际例子

amdsp -l 发现fc60 的LUN cache 状态异常WCA 和CMA 未激活另外在amlog 中发现如 下信息Write Back Caching Could Not Be Enabled amdsp -a 察看电池状态正常 故障原因

可能的原因是更换电池并执行ammgr -b 操作后控制器内的电池状态信息未能更新 Action Plan

通过串口进入控制器执行ccmPartitionMirroring, 如状态仍未恢复正常需执行rpaBatteryInit 命令 54、 在HPUX 11.11系统上面内核参数shmmax不能超过1GB。 1).系统环境 HP9000 N4000,HPUX 11.11,Sybase 12.0 2).报错现象 在用SAM修改系统的内核参数shmmax时,当我把数值更改为1,500,000,000的时候,SAM会弹出报错窗口:The value specified for tunnable parameter \to \ 3).解决方法一 安装补丁程序 PHKL_24032。 4).解决方法二 A.用vi编辑/usr/conf/master.d/sysv-shm文件,找到\range shmmax<=0x40000000\这一行,将其更改为“* range shmmax<=0x40000000000\ B.执行/usr/sam/lbin/getkinfo -b命令。 C.关闭SAM,重新启动SAM,这是就可以更改shmmax的数值为大于一个GB了。

55、Data protector 5.0安装后第一次运行就报错\这样的错误。 1).系统环境 HP9000 N4000,HPUX 11.11。Data Protector 5.0. 2).报错现象 DP50的各个级别的菜单都不好用,点击时都会报这样的错误。DP5软件不能使用。 3).解决方法 检查/etc/opt/omni/cell目录下的配置文件,发现有的文件里的主机名字是大写的,有些是小写的,而主机的实际名字是大写的,经过OVCC的确认,确实是大写机器名字的原因。将机器名字改为小写的,重新安装DP5软件,测试各项功能正常。即,DP5,包括原来的OMNIBACK软件,是不支持大写机器名字的。可能原因是,程序的代码是为WINDOWS写的。 56、Omniback 3.0 运行报错\can not open database/file\: 1)、系统环境 HPUX 11.00 omniback 3.0 2)、报错现象 点击omniback 的菜单不好用,无法进行正常的备份和恢复操作。 3)、故障原因 经过检查,发现 /var/opt/omni/db/cdb 目录下的omni库文件全部丢失。

- 29 -

HP9000系统知识手册

4)、解决方法

a. 重新配置一个media pool ,定义logic device,找到备份omniback database 的磁带,import 到media pool ,执行恢复操作,注意不能恢复到原来目录。停掉omniback 的服务,把恢复的database 文件拷贝到 /var/opt/omni/db/cdb.

b. 重新配置一个media pool ,定义logic device, 重新import 所有的磁带。此方法非常费时。

57、xp的操作口令: raid-install raid-initialsetup raid-online exist-pintrack

容灾的口令:horc-forcibly

58、How do you mirror vg00 on Itanium systems that are running B.11.23 ? RESOLUTION

NOTE: There are differences in procedure between 11.22 and 11.23. Please refer to KBRC00011156 for B.11.22. 1). From HPUX, use vgdisplay to identify the disk that is in vg00. Use ioscan to find the spare disk. # vgdisplay -v --> vg00 is on /dev/dsk/c2t1d0s2 in this example # ioscan -efunC disk --> Let's assume c3t2d0 for this example 2). Create the system, OS, and service partitions. # vi /tmp/partitionfile 3 EFI 500MB HPUX 100% HPSP 400MB

# idisk -wf /tmp/partitionfile /dev/rdsk/c3t2d0 idisk version: 1.31

********************** WARNING *********************** If you continue you may destroy all data on this disk.

Do you wish to continue(yes/no)? yes <-- Answer \3). Create device files needed for the new partitions. # insf -eC disk

4). Verify the partition table. # idisk /dev/rdsk/c3t2d0

5). Verify that the device files were created properly. # ioscan -efnC disk --> c3t2d0 is 0/1/1/1.2.0

6). Populate the /efi/hpux/ directory in the new EFI system partition. # mkboot -e -l /dev/rdsk/c3t2d0

7). Change the auto file for the mirror to boot without quorum. NOTE: Using \

# echo \

# efi_cp -d /dev/rdsk/c3t2d0s1 /tmp/AUTO.lq /EFI/HPUX/AUTO

NOTE: We assume that if we boot from the primary, the mirror is fully functional and therefore we don't need to override quorum. Your site might require that both disks override quorum. 9). Verify the contents of the auto file on the primary and the mirror. NOTE: Using \

# efi_cp -d /dev/rdsk/c2t1d0s1 -u /EFI/HPUX/AUTO /tmp/AUTO.pri # efi_cp -d /dev/rdsk/c3t2d0s1 -u /EFI/HPUX/AUTO /tmp/AUTO.alt # cat /tmp/AUTO.pri # cat /tmp/AUTO.alt

10). Add the new partition to vg00. NOTE: Using \

- 30 -

HP9000系统知识手册

# pvcreate -fB /dev/rdsk/c3t2d0s2 # vgextend vg00 /dev/dsk/c3t2d0s2 11). Mirror all logical volumes in vg00. NOTE: Using \

# lvextend -m 1 /dev/vg00/lvol1 /dev/dsk/c3t2d0s2 # lvextend -m 1 /dev/vg00/lvol2 /dev/dsk/c3t2d0s2 # lvextend -m 1 /dev/vg00/lvol3 /dev/dsk/c3t2d0s2 # lvextend -m 1 /dev/vg00/lvol8 /dev/dsk/c3t2d0s2 12). Add the new disk to /stand/bootconf. NOTE: Using \ # vi /stand/bootconf l /dev/dsk/c2t1d0s2 l /dev/dsk/c3t2d0s2

13). Verify that the new disk was added to vg00, and the lv's are in sync. # vgdisplay -v vg00

14). Verify that the BDRA was updated properly. Take note of the HW paths for step 15. # lvlnboot -v

15). Add EFI primary and high availability boot path menu entries. # setboot -p 0/1/1/0.1.0 <-- Set primary disk # setboot -h 0/1/1/1.2.0 <-- Set mirror disk # setboot -b on <-- Set autoboot on

16). Verify that the primary and mirror boot paths are configured properly. # setboot

17). Test the new mirror by booting off of it. # shutdown -r -y 0

18). Select \ EFI Boot Manager ver 1.10 [14.61] Firmware ver 2.21 [4334] Please select a boot option

HP-UX Primary Boot: 0/1/1/0.1.0 HP-UX HA Alternate Boot: 0/1/1/1.2.0 EFI Shell [Built-in]

20). Verify which disk/kernel you booted from. # grep \ vmunix: Boot device's HP-UX HW path is: 0.1.1.1.2.0 21). Remove temporary files.

# rm /tmp/partitionfile /tmp/AUTO* Done. HP ONLY

For 11.22 -> there is no HPSP partition and the setboot command does NOT add boot options to the EFI menu, see KBRC00011156 step D) to add boot options under 11.22 ALT KEYWORDS

setboot B.11.23 alternate mirror efi ipf ipf2 ia64 59.集群中锁盘上的锁盘有故障。

处理过程:

1).#ioscan –fnCdisk c0t5d0 “claimed”

2). 用dd ,diskinfo 等命令,测试正常

3).查看FC60,所有DISK,LUN正常,用cmviewcl –v 正常. 4).然后用下面的命令检查锁盘上的标志信息是否存在 # echo '0x2084?4D' | adb /dev/dsk/c0t5d0

- 31 -

HP9000系统知识手册

没有锁盘标志,需要用cmapplyconf ,重新写锁盘,考虑得到正确的CLUSER配置文件和PKG的配置文件,因为/etc/cmcluster下的配置文件有时不准确. 5).#cmgetconf –C cluster cluser.ascii 6).#cmgetconf –P pkg1 pkg1.ascii #cmgetconf –P pkg2 pkg2.ascii 7).让用户停止CLUSER 8).#vgchange –a y vglock,

9).#cmcheckconf –C cluster.ascii –P pkg1.conf –P pkg2.conf 检查通过

10).cmapplyconf –v –C cluster.ascii –P pkg1.conf –P pkg2.conf 成功完成!

11).cmruncl –v 反复测试 一切正常

总结:1)./etc/cmcluster下的配置文件,很多用户为了学习,无意中把它修改,最好还是用cmgetconf 命令去取出现在运行系统的正确配置.

2).认真研究SYSLOG AND CLUSTER,做好PM的每一个步骤,发现问题,正确处理,用户就会体会到HP PM的价值.

60.新装RP7410做完镜象后重启失败的故障排除 故障现象:

在华为生产中心安装调试RP7410时,曾多次发生做完镜象后重启,在经过十秒中断后,进入系统引导时,RP7410会亮FAULT灯,导致重启失败,并产生HPMC。在GSP下检查LOG发现其中有ERR_CPU_BOARD的报错,多次重启机器,都是FAULT灯亮而失败。 解决办法:

方法一:重新插拔PCI board。 1)、拆开RP7410背板和侧板;

2)、卸下侧板后,将PCI board旁边的固定架上方有四颗螺丝松开,即可卸下固定板;

3)、注意要将PCI board上的Core I/O卡、网卡、光纤卡或SCSI卡等PCI卡做好位置记号拔出,并将PCI board上的连线也做好记号拔开;

4)、然后,抓住塑料把柄向外拖PCI board; 5)、重新插拔后,按拆开顺序重新装回PCI卡;

6)、重启机器,经过一段时间烤机问题一般都会解决。 方法二:如果经过方法一的步骤还是不行,则需要拨打800调拨新的PCI board(备件号:A6752-69014)去更换了。当然,还是需要RC的诊断确认。 故障分析

可能是某批次的RP7410的PCI board的接触不是很好,安装也有些不到位,所以需要重新安装,如果重新安装还是不行,就只能是怀疑PCI board坏了。 61. EVA Disks report one loop connection lost 具体内容:

在SMA中看到EVA中有2块DISK (0-10-3,0-10-4)频繁出现single port error,但DISK可以最常使用,fault 指示灯也没有亮,

正常的绿灯闪烁。是否2块disk都有问题?其实更换0-10-3后问题就解决了。由于FC disk都有2条loop connection,失去一条连接后,disk

是可以正常使用的,但是前一块disk的这种single port error会影响到后一块disk的状态。一般来说在troubesooting时可以把前一块disk remove

后,在进行monitor,如果后面的disk不再报错,那么只更换前一块盘就可以解决问题。 62. MC中共享卷的扩卷 具体内容:

将/filesystem扩充至10G,逻辑卷名为/dev/vgname/lvname,MC环境为node1和node2,应用包名为package,缺省运行在node2上 1、 cmhaltpkg –v package 2、 vgchange –c n /dev/vgname 3、 vgchange –a y /dev/vgname

- 32 -