中国电信产品维护经理认证体系教材-idc和云

? 如果telnet登录该设备失败,则主日志的结果为“NOK”,明细日志的结

果为“登录失败!”;

? 如果telnet登录该设备成功,但执行脚本超时或失败,需要重试3次,如

果最终仍旧执行失败,则主日志的结果为“NOK”,明细日志的结果为“脚本执行失败!”;

? 如果脚本执行成功,但经过后台分析后产生告警,则主日志的结果为

“NOK”,明细日志的结果为telnet返回信息,且上报一条告警; ? 如果脚本执行成功,则主日志的结果为“OK”,明细日志的结果为telnet

返回信息。

6.3.2.5机房巡检

先查询出该机房包含的所有网络设备,然后多线程(通过线程池控制最大线程数)对所有设备进行巡检,每个线程的步骤同“设备巡检”。

? 如果所有巡检设备结果都正常,则主日志表(idc_inspection_log)的content

字段值为“OK”;

? 如果所有巡检设备结果都不正常,则值为“NOK”; ? 如果部分巡检设备结果不正常则值为“POK”。 6.3.2.6机架巡检

先查询出该机架包含的所有网络设备,然后多线程(通过线程池控制最大线程数)对所有设备进行巡检,每个线程的步骤同“设备巡检”。

? 如果所有巡检设备结果都正常,则主日志表(idc_inspection_log)的content

字段值为“OK”;

? 如果所有巡检设备结果都不正常,则值为“NOK”; ? 如果部分巡检设备结果不正常则值为“POK”。 6.3.2.7告警分析

巡检过程不做告警分析,系统会部署一个单独的模块对巡检结果进行分析生成告警。

6.3.2.8巡检结果入库

每执行一次巡检任务,都需将巡检结果写入到日志主表(idc_inspection_log)和明细日志表(idc_inspection_log_detail )。

6.3.3全国19省份IDC集中监控

现阶段已完成福建省IDC业网管系统的互联,并获取了较多互联工作经验,为了进一步推进各省的互联工作,2014年需对江苏、北京、湖北、湖南、广东等各省进行推广工作,实现组织机构、机房、机架、网络设备、端口等基础数据同步、网络设备/端口数据配准、流量接口、告警接口、性能接口和、巡检接口、统计报表上报等互联接口。

实现集团IDC业务网管系统与全国19省IDC网管系统对接;实现全网资源与网管设备数据的清查,达到在用设备必纳入资源管理,提升资源数据与网管数据的一致性;实现省IDC网管系统流量、告警、性能、巡检、统计报表时时上报,便于集团IDC网管统计监控全网运行情况。

6.3.4云网络质量检测管理 6.3.4.1云网络SLA管理

由于云公司的客户(百度公司)对于园区网络不可用时长最长允许4.5分钟,所以需要集团IDC网管系统实现故障实时上报功能;该功能需开发syslog采集功能实现实时上报,对于告警声音,云公司要求更换具有识别度高的告警声音,便于区分紧急、主要、次要告警,关于告警类型,云公司要求对告警类型列使用不同的背景色区分告警级别,紧急告警采用红色背景、主要告警采用桔红色背景、次要告警采用淡黄色做背景,当端口状态变为DOWN时上报紧急告警,当端口状态变为UP时上报次要告警。

6.3.4.2云应用监控功能

集团所有的应用都部署在亦庄云环境上,为保证云环境的稳定,各个应用能正常运转,能及时有效的查询到各个应用的配置参数。开发一套基于web的云环境管理平台。

? 基础管理:服务器管理,用户管理,邮件,短信通知管理。

? 应用管理:服务部署的位置,运行参数,拨测周期,拨测失败后通知人员群组。 ? 服务重启:服务参数配置修改以后需要重启监控应用本身的功能,以及各个子应

用的重启功能。

6.3.4.3设备IP及U位对应关系

管理设备位置信息,记录设备关联IP,可通过设备IP,客户设备编码的信息定位设备放置的机架机位。

>>灞曞紑鍏ㄦ枃<<
12@gma联系客服:779662525#qq.com(#替换为@)