中国电信产品维护经理认证体系教材-idc和云 下载本文

生告警,并通过邮件、短信等方式通知维护人员。

6.3.1.3服务器磁盘利用率监控

监控服务器硬盘、磁盘分区等资源使用情况,以可视化图形直观显示,定时采集刷新。出现异常则产生告警,并通过邮件、短信等方式通知维护人员。

6.3.1.4应用系统监控

定制应用系统监控监视器,设置扫描频率及监控指标,监控各项指标变化情况,对异常现象进行告警,并通过邮件、短信等方式通知维护人员。

6.3.1.5接口监控

自动扫描与外系统的接口,获取各接口的运行状态、接口描述、速率、输入流量、输出流量等指标。

6.3.1.6ORACLE数据库监控

按采集规则扫描ORACLE运行状态,监控其运作情况,对ORACLE连接进程、资源使用情况、客户端连接程序进行监控。提供会话连接数阀值配置,出现异常则产生告警,并通过邮件、短信等方式通知维护人员。

a) 基本信息:实例状态、主机名、DB名称、DB版本、位长、并行状态、例程名、

例程开始时间、限制模式、归档模式、归档路径、只读模式、是否使用spfile启动以及启动路径。

b) 表空间的类型、使用量、可使用百分率、PSFI值、读写平均时间、空闲扩展大小、

最大扩展大小、扩展次数、Next扩展大小。

c) 数据文件监控,针对指定数据文件,分析其当前大小,以及读写次数、块数与所

花时间等。

6.3.1.7JOBSS进程监控

扫描JOBSS进程运行状态,监控其运作情况,出现异常则产生告警,并通过邮件、短信等方式通知维护人员。

a) 基本信息:操作系统、操作系统版本、当前可用堆栈、堆栈大小、活动socket

连接数、重启次数、当前目录、运行状态、健康状况、服务器、中间件版本、JavaVendor、Java版本、服务监听端口和SSL端口信息等。

b) 监控当前动态高速缓存的使用率、内存中最大高速缓存条目数和当前高速缓存条

目数等。

c) 监控JDBC连接池大小、空闲连接池大小、连接池分配连接数量、连接池返回连

接数量、连接池并发等待数量、连接池平均使用时间、连接池平均等待时间、连接池故障数、连接池使用百分率、连接池关闭连接数量和创建连接数量等。 d) 监控当前正在处理使用的会话数、当前有效的会话数、已创建的会话数、无效的

会话数和由超时而导致无效的会话数等。

6.3.1.8URL监控

可对URL链接进行监控,配置URL链接监视器,设置扫描频率,匹配内容等监控指标,对异常现象发出告警提醒。

6.3.1.9自定义进程监控

支持用户配置自定义的进程监视器,监控通用命令行、LINUX进程、通用SSH命令、数据库SQL操作等。设置阀值,对异常情况发出告警提醒。

6.3.1.10监控报表

提供监控报表查询,多维度汇总监控记录,分析监控对象运行情况。

6.3.2智能业务巡检

以客户、业务为维度,对配置省份的的IDC星级机房网络设备、端口与链路运行状态、流量统计、IP地址等资源使用状态,以及相关设备的配置文件、系统日志变更情况等进行业务级巡检管理。集团级IDC综合网管系统周期性或实时向省级IDC业务网管系统发起自动巡检指令,对各省级IDC业务网管系统返回的巡检结果进行集中统计分析、展示及报警处理。

以客户、业务为维度,对配置省份的的IDC星级机房网络设备、端口与链路运行状态、流量统计、IP地址等资源使用状态等进行业务级巡检管理。集团级IDC综合网管系统周期性或实时向省级IDC业务网管系统发起自动巡检指令,对各省级IDC业务网管系统返回的巡检结果进行集中统计分析、展示及报警处理。

后端巡检全过程如下:

关联IDC_INSPECTION_PLAN 和 idc_inspection_strategy 表获取巡检任务信息由策略表的INSPECTIONTIME和TYPE字段确定巡检任务是否开始执行?设备巡检或者机房巡检?设备巡检机房巡检根据设备类型(和巡检指标编号查询指令模板表,逐个指标获取到相应的脚本通过线程池方式并行对机房内所有网络设备进行设备巡检下发执行脚本,并获取返回信息将执行失败信息或返回结果信息写入到巡检日志主表和明细表

6.3.2.1巡检任务获取与周期执行

关联IDC_INSPECTION_PLAN 和 idc_inspection_strategy 表,由策略表(idc_inspection_strategy)的INSPECTIONTIME和TYPE字段决定执行周期与每次执行的时间点,由巡检计划表(IDC_INSPECTION_PLAN)的STARTTIME和ENDTIME

字段决定是否需要执行。

6.3.2.2巡检脚本获取与执行

巡检脚本的获取思路和自动激活脚本的获取思路完全一致,且共用数据字典和自动激活关键表。 6.3.2.3指令模板管理

即自动激活的“指令模板管理”模块,根据设备型号和巡检指标(即原子命令)配置对应的巡检脚本(即指令)。

需要扩充已有的“指令模板类型”,增加“巡检指令模板”这一类型。该类型指令模板下包含的原子命令暂时只包含山西需求中提到的5个常规巡检项目,如下:

? 系统告警 ? CPU利用率 ? 内存利用率 ? 硬件状态 ? 温度 6.3.2.4设备巡检

根据设备类型(设备表的DEVMODEL_ID字段)和巡检指标编号查询指令模板表(nms_instruction_template),获取到巡检该指标的脚本然后下发执行。

巡检指标由巡检计划表的巡检内容字段(CONTENT)指定。该字段可包含多个巡检指标编号,中间以逗号隔开,巡检指标编号的取值来自原子激活命令字典(IDD_IDC_ACTIVATE_COMMAND),如果巡检指标大于1个,则需要逐个脚本下发并获取返回信息。

? 如果系统中无该设备的telnet权限,则主日志的结果为“NOK”,明细日

志的结果为“无该设备的telnet权限!”;

? 如果查询不到对应的指令模板记录,则主日志的结果为“NOK”,明细日

志的结果为“获取不到该设备的指令模板!”;