ORACLE数据库巡检模板 下载本文

数据库YYYY:

从上述的情况中看出,数据库:服务器CPU idle基本在75%以上,CPU资源较为空闲。 建议:

当CPU的使用率超过80%,要注意监控是否有僵死进程,如果有僵死进程占用CPU,需要将僵死进程kill掉。如果有正常进程占用大量CPU,需要查看是否属于正常业务进程等。

健康检查报告 第9页

4. 数据库配臵

本次检查工作主要针对数据库XXXX。

4.1 数据库版本和单独补丁

目前已经安装的单独补丁列表如下: opatch lsinventory -oh $ORACLE_HOME

Patch Base Bug(s) Installed on 建议:

4.2 CRS版本和单独补丁

CRS安装单独补丁列表如下:

opatch lsinventory -oh $ORA_CRS_HOME

Name Version Installed on 建议:

4.3 ORACLE CLUSTER配臵

OCR使用和备份都正常。相关CRS的资源和服务都正常。

$ olsnodes $ ocrcheck $ ocrconfig -showbackup $ crsctl check crs CSS appears healthy CRS appears healthy EVM appears healthy $ crs_stat -t

健康检查报告 第10页

4.4 数据库产品选项

当oracle软件安装时,会选择要安装的产品。有某些产品的安装是需要license的,本次检查不涉及

license问题。一般,很多系统安装的数据库产品选项根本未被使用。以下列出的安装产品选项可供未来的应用开发参考,或是可以被确认有哪些产品选项未在原计划之内。 以下是数据库安装的产品选项:

Parameter Value 4.5 初始化参数文件

数据库SPFILE参数指定了当前使用的数据库配臵参数,在数据库启动时被使用。在附录A列出了数据库所有的非默认值的参数。 建议:

1. 数据库的参数可以看出大部分都是经过精心设臵的。

2. 建议调整的参数值,请在测试环境数据库中测试确认之后,再调整于生产环境数据库。

4.6 CRS日志文件

从Oracle 10g RAC版本开始,新增加CRS组件。CRS对于RAC使用是必不可少,因此crs的稳定对于RAC数据库的正常运行至关重要。在健康检查中会检查CRS、CSS和EVM的LOG信息。 .

建议:

2.检查CRS其他相关进程日志,没有发现问题。

4.7 RDBMS运行日志和跟踪文件

Oracle 数据库进程生成跟踪文件来记录错误或冲突,这些跟踪文件可以用来进一步分析问题。数据库参数'max_dump_file_size'限制了这些跟踪文件的大小(以操作系统块的大小为单位)。应当有足够的硬盘空间来容纳最大值的设臵,否则的话应当修改上述参数的设臵。

如果参数'max_dump_file_size'设得太大,会超过硬盘空间容量;如果设得太小,又不能容纳足够的出错信息供oracle 支持服务部门分析问题。此参数可以在数据库会话级设臵,这样可以有选择性地设臵较大值。 注意每天监控运行日志文件中的出错信息,以便于在问题还是隐患的时候及时发现并解决掉。建议每月初将当前的alert.log重新命名以作备份,同时也可以避免alert.log文件变得太大不易管理。 在数据库:实例的运行日志文件发现的最近一月内的主要错误如下所示:

建议:

健康检查报告 第11页

4.8 控制文件

每个数据库至少有一个控制文件。控制文件记录了数据库的物理结构及同步信息。

Control file location

控制文件路径如下:

Name Status 目前所有的控制文件文件存储在已经做了硬件RAID的磁盘阵列上面,提供了硬件级别的保护。 建议 :

4.9 Redo log 文件

对于恢复操作,最为关键的结构是在线Redo Log。在线Redo Log一般由两个或两个以上预先分配的存储数据库变化的文件组成。为了防止例程故障,每个数据库的实例都有相关的在线Redo Log。

每个数据库至少有两个Redo Log组,每组至少有一个日志文件。Oracle的多重在线Redo Log文件可以确保在线日志文件的安全。对于多重在线Redo Log文件,LGWR同时将相同的Redo Log信息写入不同的Redo Log文件中,从而减少单个文件丢失的损失。

当Oracle无法访问一个Redo Log文件时,这个文件状态变为INVALID。当Oracle推测一个Redo Log文件不完整或者不正确时,它的状态变为STALE。当一个STALE的文件被重用时,即其所在日志文件组活动时,此文件也能够使用。

在线Redo Log文件减少了数据库数据丢失的损失,比如当发生例程故障时,没有被写入数据文件的数据可以从在线Redo Log文件中恢复。

Group # Thread Sequence Bytes MemberArchived Status First Change First # # s # Time 健康检查报告 第12页