故障排查 下载本文

无线核心网故障排查思路

一般故障处理包拪信息收集、 故障判断、 故障定位及故障排除四个步骤。

信息收集:信息收集为故障排查的第一步,即收集相关故障现象及信息,为故障判断提供分析的依据。在本仿真软件中,可以通过查看告警信息、 网络拓扑中的网元状态、 PING/TRACE的结果、 拨测结果收集故障信息。

故障判断:依据收集完所有的故障信息,对引起该故障现象的可能原因迚行分析。

故障定位:查看相关操作或数据配置,对可能原因迚行逐一排除,最终定位故障。

故障排除:对“ 设备配置” 和“ 数据配置” 模块的故障迚行纠正,从而实现故障的消除。

故障示例

故障现象1: rru射频故障 故障排查:

根据告警分析,此类故障需检查RRU与天线连线、频率资源匹配配置。 1. 检查“设备配置”中RRU相关物理设备和连线配置;

2. 检查“数据配置”RRU的天线收发模式与数据配置是否匹配、频率是否匹配。

故障现象2:

“ 当前告警”显示“S1-C链路故障”,并且拨测测试后,“业务观察”提示“ S1-C链路故障” 故障排查:

分析该故障应该由基站侧与核心网的MME直接对接参数不匹配。 对比BBU-SCTP配置和核心网MME-eNodeB(偶联)对接配置,修改不匹配的配置。

1、中心机房未做MME到ENODE的静态路由。

2、BBU到MME之间的参数配置;MME及HSS之间的参数配置

3、查看ENB的BBU配置里面的SCTP,以及核心网MME当中的路由,以及ENB的偶联配置是否正确

故障现象3:

S1-MME接口物理连接/链路故障、S11接口链路故障、S6a接口链路故障、S5S8接口控制面路由不可达 故障分析与定位:

1.MME与eNodeB之间的物理连接故障。 2.MME与eNodeB之间的路由故障。 3.MME与eNodeB之间的偶联故障。 4.SGW物理接口掩码错误 故障现象4:

“业务观察”中提示信息为:用户鉴权失败 故障分析及定位:

此时系统只有鉴权失败的业务类的故障。 1.终端与HSS签约信息的Ki不一致; 2.终端与HSS签约信息的鉴权算法不一致。

故障现象5:

“业务观察”中提示信息为:数据传输中断 故障分析及定位:

在LTE系统中,用户面数据传输的路径为:终端<->BBU <-> SGW <->PGW,分析导致“数据传输中断”的可能原因包括: 1.S1-U接口用户面故障,即BBU与SGW之间的路由故障; 2.S5S8接口用户面故障,SGW与PGW之间的GTP-U路由故障。 故障现象6:

业务观察显示“核心网机房-数据传输中断” 故障排查:

1.检查无线“ BBU-静态路由”配置和核心网“ SGW与eNodeB对接配置”是否匹配,修改不匹配的数据; 2.SGW与PGWS5/S8-U之间的路由错误。

如果拨测环境是工程模式,还需要检查排查路由故障等承载网故障。 故障现象7:

物理接口告警、连线告警和射频告警消除,但终端“工程模式”仍显示搜索不到小区信号 故障排查:

故障分析应该和空口网络对接参数相关。

根据分析,检查基站侧、终端配置以及核心网三者之间的移动国家码和网络号是否匹配.

故障现象8: 找不到相关SGW 故障排查: EPC地址解析错误。 故障现象9:

找不到用户APN(test) 故障排查: APN上下不一致。 故障现象10: 找不到用户归属HSS 故障排查: 号码分析没设置。 故障现象11: 核心网信令链路故障 故障排查:

1.一般是HSS数据配置错误或有关HSS的数据配置错误(MME与HSS连接数据配置不一致);

2.SGW与PGW的S5/S8-C的IP地址错误或者路由错误。 故障现象12: TA错误导致接入失败 故障排查:

TA的数据配置错误。 故障现象13:

用户信息错误导致用户接入失败 故障排查:

全局移动参数MCC码错误。 故障现象14: 用户不存在 故障排查:

HSS用户标示的IMSI与业务验证边的IMSI不一致。 故障现象15: 搜索不到小区 故障排查:

业务验证小区参数错误

1.eNB内侧数据配置错误(或连线); 2.拨测频段错误。

承载网故障排查步聚

故障排查分析与定位:

1. 两端接口IP地址或子网掩码不匹配; 2. 两端接口VLAN配置不匹配;

3. 两端接口间线缆连接有问题;(使用光路检测工具) 4. 两端接口间的OTN配置有错误。

问答区

1.在“工程环境”下,无线核心网和承载网联合起来测试,要怎样在SW、承载中心机房、A站点机房进行接口配置、静态路由配置?(能不能 提供有关核心网与承载网联合测试的视频)

答、配置BBU到MME,BBU到SGW的两条路由(这两条路由在核心网机房SW上配置,目的地址是MME与基站偶联的地址,以及SGW与基站对接的地址,下一跳设置为对应设备的接口板IP地址,掩码4个255,同时注意静态路由引入OSPF);MME和SGW配置到基站的路由的下一跳,设置为与CN网相连的SW的接口的IP;SW和承载中心机房的配置参考PTN与PTN之间的连接配置;A站点机房的网关和BBU配置的到SGW的静态路由的下一跳以及和A站点机房相连接的PTN端口的地址,这个3个地址要一致。

2.“业务验证”时,模拟SINR与模拟用户数之间有什么关系,是否影响信号传输?

答:严格来说,SINR和用户数成反比。但在我们的软件没有相互关系。

3.“A站点机房_无线”中小区配置下的“UE的天线发射模式、下行/上行MCS配置、????”配置不当,是否会影响小区之间的切换?(能否提供相关的示例数据配置) 答:不影响切换,但会影响速率。

4.“核心网信令故障”的具体定位和排除方法

答:检查MME和SGW之间,MME和HSS之间的路由和对接

5.“S1-C链路故障” 的具体定位和排除方法 检查MME侧和BBU侧的偶联地址

2.“业务验证”时,模拟SINR与模拟用户数之间有什么关系,是否影响信号传输?

SINR为信噪比,一般来说SINR设置较大较好,用户数设置较小较好,主要是考虑扇区的负载。他们之间没有对应关系。

3.“A站点机房_无线”中小区配置下的“UE的天线发射模式、下行/上行MCS配置、····”配置不当,是否会影响小区之间的切换?(能否提供相关的示例数据配置)

这些参数对小区切换没得影响,一般来说发射模式、上下行MCS主要影响速率,在测试过程中可以调节,对应下载速率。

4.“核心网信令故障”的具体定位和排除方法 检查MME到HSS之间的路由等配置

5.“S1-C链路故障” 的具体定位和排除方法

1、中心机房未做MME到ENODE的静态路由。

2、BBU到MME之间的参数配置;MME及HSS之间的参数配置

3、查看ENB的BBU配置里面的SCTP,以及核心网MME当中的路由,以及ENB的偶联配置是否正确