基于MATLAB故障诊断系统设计 下载本文

沈阳理工大学学士学位论文

使得新坐标系的原点与样本点集合的重心重合,新坐标系的选取的第一轴与数据变异的最大方向对应,新坐标系的第二轴与第一轴标准正交,并且对应于数据变异的第二大方向…,以此类推。这些新轴分别被称为第一主轴、第二主轴…。若经舍弃少量信息后,由主轴p1,p2...pk 构成的子空间能够十分有效的表示原数据的变异信息,则原来的m维空间就被降至k维,k?m,这个新生成的k维子空间被称为k维主超平面。当k=2时,就称其为主平面。可以用原样本点集合在主超平面上投影来近似地表示原样本点集合。原样本点集合在主超平面的第h主轴上的投影构成综合变量th?Rk,称为第h主元得分向量,主轴的方向向量ph称为主元负荷向量,h?1,2...k。

常用主元得分向量的计算步骤:对于正常运行的生产过程的监控数据矩阵

X?Rm?n,n是采样次数,m是变量的个数。

1、在实际问题中,不同的变量具有不同的量纲,为消除由于量纲不同可能带来的一些不合理的影响,通常应对测量数据进行标准化处理:

m ,X?(Xi?E(Xi))/var(Xi) (i?1,2,..... X?[X1,X2,.....,Xm] (3.6)

2、计算标准化后的数据矩阵X的协方差矩阵:

1 V?XTX (3.7)

n?1式(3.7)中的V也是标准化后的矩阵X的相关系数矩阵。

3、求协方差矩阵V的m个特征值?1??2?.....??m,以及所对应的特征向量

p1,p2,.....pm,其中pi 之间是相互标准正交的,即piTpi?1,piTpk?0 ,当i?k时,

i,k?1,2,.。m.

4、求第h主成分th,有:

th?Xph,h?1,2,.....,m (3.8)

式(3.8)中,主成分th是原数据列向量X1,X2,.....,Xm的线性组合,组合系数即为ph,从这个角度看,又可以说th是个新的综合变量。 3.3.3 确定主元个数的方法

在信息抽取过程中,合理确定主元个数十分重要,主元选取多则模型相对精确,但增加了分析与诊断的复杂性,无法有效清除噪声;主元个数选取过少,则不能充分提取

16

沈阳理工大学学士学位论文

原始数据空间的信息,使得分析与诊断的误差增加

[4,15]

。在实际检验中可采用交叉检

验法来确定最优主元个数,一部分用来建立主元回归模型,另一部分用来检验所建立的主元模型。通过保留不同数据的主元,建立若干主元模型,然后在检验数据上测试这些模型,并从中选取在检验数据中测试误差最小的那个主元回归模型。有几种技术可以确定主元个数,但目前为止还没有出现一种占主导地位的技术。下面简单介绍两种方法:

1.特征值方差累计贡献率

方差累计贡献率(Cumulative percent variance,CPV)是根据主元分析理论中样本协方差矩阵的最大特征值所对应的特征向量即是第一主轴方向,该特征值就是第一主元的方差,类似地,第二主元的方差和方向是由协方差矩阵的第二大特征值及对应的特征向量来决定。每个主元的方差和总方差的比值称为该主元对样本总方差的贡献率。确定主元贡献率累积和百分比的计算公式为:

CPV(k)?100(k??i?1i??i?1m )% (3.9)

i式(3.9)中,?i是X的协方差矩阵的特征值,m为变量的个数。使用该方法必须人为地选定一个期望的CPV值作为准则,如90%,95%或 99%。当CPV值大于期望的值时,对应的k值就是应该保留的主元个数。由于CPV期望值的选择是根据人为经验,所以该方法的主观性很强。

2.平均特征值法

平均特征值法(Average eigenvalue,AE),该方法选取大于所有特征值均值的特征值,作为主元特征值,同时舍弃掉那些小于均值的特征值。对应的特征值的序号即为确定的主元数。相关系数矩阵的特征值的均值计算公式是:

1m ????i (3.10)

mi?1m是变量个数。 3.3.4 主元模型的建立

在实施多变量统计分析时,需要建立一个反应过程正常运行的主元模型。将反映过程正常运行的历史数据收集起来,对这些数据进行主元分析,建立主元模型。由于主元分析的结果受数据尺度的影响,因此在进行主元分析时,需要先将数据标准化,即将每

17

沈阳理工大学学士学位论文

个变量的均值减掉然后除以它的标准差。对标准化后的数据进行主元分析,如果只取前 k个主元,那么可以得到下面的主元模型:

X?t1p1?t2p2?...?tkpk?E?Xp?E (3.11)

TTT?t2p2?...?tkpk式(3.11)中,Xp?t1p1。

TTT3.3.5 主元分析的统计量

为了利用主元模型对生产过程进行监控,需要有过程正常的数据来确定过程运行的控制限。典型的监视控制图包括主元得分图和平方预测误差(SPE)图。当主元模型的SPE 或得分超出控制限时,就认为过程中出现了不正常情况。

对于生产过程中采集到的数据矩阵Xm?n,n为采样次数,m为变量个数,利用式(3.6)进行标准化后变为Xm?n ,求出Xm?n的协方差的特征值?i和特征向量pi,i?1,2,...,m后,进一步利用式 (3.8)求出个m主元得分向量T?(t1,t2,...tm)。在选取了其中k(k?m)个主元后得到Xm?n的重构数据:

??TPT?tpT?tpT?...?tpT (3.12) Xkk1122kk以及重构误差E:

? (3.13) E?X?X主元模型的预测误差平方和 SPE也称作Q统计量可以定义为:

Qi?eiei?Xi(I?PkPk)Xi (3.14)

TTT式(3.14)中ei是式(3.13)中E的第i行,Pk?[p1,p2,...,pk]是前个主元负荷向量,I为n?n的单位阵。SPE或Q统计量代表了数据中没有被主元模型所解释的变化。当SPE过大时,说明了过程中出现了故障现象,从过程正常运行数据所建立的模型已不再适用。控制限的计算是建立在一定假设基础上的,当检验水平为?时,SPE控制限可以按下式计算:

QUCL?a(b?cz?) (3.15)

d式(3.15)中z? 为标准正态分布的100?百分点,其他参数如下:

a?i?k?1??

in

18

沈阳理工大学学士学位论文

b?1?[?2h0(h0?1)](2?2h0)a2

c?ad?1h0

?2?i?k?1??nn2i

?3?h0?i?k?1??3i

(1?2a?3)3?22

若监测数据的Q统计量没有超出上限,属于正常数据;反之,数据为异常数据。 还可以通过Hotelling T2统计量来实现对多个主元同时进行监控。T2统计量通过主元模型内部的主元向量模的波动来反映多变量变化的情况,T2统计量的定义为:

Ti?ti?ti?XiPk?PkXi (3.16)

2?1T?1TT式(3.16)中ti是Tk矩阵中的第i行,Tk由构成主元模型的k个得分向量所组成;?是由与前k个主元所对应的特征值?i(i?1,2,...,k)所组成的k?k对角矩阵。Pk为前k个主元负荷向量。

Hotelling T2统计量指标的控制限计算如下:

k(n?1)2 Tk,m,?? Fk,n?1,? (3.17)

n?k式(3.17)中,?是显著性水平,n是数据采样次数,m为变量个数。k为数据阵的主元个数,F?(k,n?k)是对应检验水平为?,自由度为(k,n?k)条件下的分布临界值。通常定义:??0.05时的置信区间边界为预警边界,??0.01时的置信区间边界为报警边界。当统计量小于控制限时,数据正常,反之,数据异常。

3.4 基于主元分析的故障诊断流程

基于主元分析的故障诊断流程,如图3.2所示:

1、对于从过程采集获得的实时运行数据进行标准化处理; 2、将实时运行数据输入建立的主元模型;

3、在主元空间和残差空间分别计算Hotelling T2和Q两个变量;

19