机房IT运维技术方案1.0 - 图文 下载本文

在对日志归类策略进行计划和配置后,应当对配置后的重要策略编辑报警功能。例如当某一重要服务器出现了Emergency级别的日志信息,则IT运维系统立即触发故障管理系统并触发报警系统,使得IT运维人员第一时间得知该系统问题。

3.1.5.3.9 快速比对分析和统计

IT运维系统支持对网络接口的流量、服务器性能的快速分析比对,协助IT运维人员分析IT组件的性能比对。

如下图,IT运维系统支持对接口流量的快速统计比对。

如下图,IT运维系统支持对IT组件按照CPU使用率、内存使用率等进行的快速排列。

如下图,IT运维系统支持对多台服务器主机的性能进行比对:

3.1.5.3.10 报表提供统计分析和决策支持

报表系统是协助IT运维人员周期性统计IT系统总体运行能力趋势的功能模块,为IT部门提供统计分析和决策支持。

统计报表能够自动的按照日、周、月、年生成报告,报告的监测器范围可以任意指定。全面的展示监测目标的运行情况和统计信息,为系统扩容和企业决策提供科学的依据。

3.1.5.4 IT系统巡检

针对IT系统的主动巡检工作是信息中心IT运维人员必备的日常运维工作之一,而在巡检的过程中,往往寻找异常信息或者故障是占用时间最多的内容,并且根据组织机构人员及工作职责不同,很难保障每一次的巡检工作都完全按照既定的巡检标准准确的被执行。IT运维系统的巡检职能可以辅助IT运维人员巡检工作,以达到提高效率,降低错误的效果。

如下图,每一次的巡检工作都是由IT运维人员手动发起的,IT运维系统可以清晰的记录巡检的工作执行情况并形成分析报告。

3.1.5.5 阀值配置

根据IT组件及业务运行的实际情况制定相应的阈值,当IT组件在运行过程中指标超过规定的阈值后,系统进行多种方式的报警。