基于MATLAB故障诊断系统设计

沈阳理工大学学士学位论文

2 PCA

2.1 定义

PCA是一种线性降维技术,是按获取数据的变化度是最优的。PCA确定了一系列相互正交的向量,称为负荷向量,按照在负荷向量方差大小来排序。给定一个训练集,它有n个观测值,m个过程变量,写成矩阵X的形式,则负荷向量可通过求解如下最优化问题的稳态点来计算:

vTXTXv max T (1.1)

v?0vv其中v?Rm。式(1)的稳态点可通过奇异值分解(SVD)来计算:

1 X?U?VT (1.2)

n?1其中U?Rm?n和V?Rm?n都是单位矩阵,矩阵??Rm?n包含沿其主对角线递减的

(?1??2?....??min(m,n)?0)实的非负奇异值,其他非对角元素为零。负荷向量是矩阵V

中的正交的列向量,训练集沿矩阵V 第i列的投影的方差等于?i2。 2.2 故障检测

正常操作可以用 Hotelling T2统计量进行描述:

T2?xTP?aPTx (1.3)

?2其中矩阵 p 包括与a 个最大奇异值相关联的负荷向量,?a包含?的前a行和列, X是一个维数为m的观测向量。给定负荷向量的数目a,T2统计量阈值可以通过分布函数计算:

(n2?1)a(1.4) T??F?(a,n?a)n(n?a)其中F?(a,n?a)是指自由度为a和n-a的F -分布的上100 %临界点。式(1.4)中的统

2计量表示的是正常过程行为,当一个向量偏离阈值就意味着故障发生。

观测空间中与(m-a)个最小奇异值相对应的那部分可以用Q统计量进行控制,Q统计量是由Jackson和Mudholkar发展的。

Q?rTr,r?(I?PPT)x (1.5)

Q统计量的阈值可以通过近似分布计算:

?2h0(h0?1)1hQ???1[?1?]2??1 (1.6) 1

0

h0c?2?2

40

沈阳理工大学学士学位论文

这里 ?i?

j?a?1??2ji,h0?1?n2?1?33?222.3 降维顺序

数据降维技术的一个关键步骤就是确定降维顺序。有几种技术可确定PCA中保留的负荷向量的数目a的值。Ku et al 推荐使用平行分析法,因为在他们的经历中,这种方法在各方面都表现的最好。平行分析法通过把方差轮廓线与通过假设独立观测变量获得的轮廓线进行比较来确定维数。降阶由两个轮廓线的交叉点确定,这种方法直观且容易自动实现,所以特别具有吸引力。

2.4 DPCA

前面讨论的 PCA 监控方法都隐含地假定:一个时刻的观测值对于前面时刻的观测值来说是统计独立的。对于典型的工业过程,这一假定只对长采样间隔是有效的,例如 2-12h。这间接地表明需要一种考虑到数据中序列相关性的方法,用来实现快速采样时间的过程监控方法。PCA 方法可以用前边l个观测对每个观测向量进行扩充的方法考虑序列相关性。

?xtT?X(l)??xtT?1?xtT?l?n?xtT?1xtT?2xtT?l?n?1xtT?l??xtT?l?1?xtT?n?? (1.7)

其中,xtT是t时刻在训练集中的m维观测向量。通过对式(7)的数据矩阵进行PCA处理,可以从数据中直接得到多变量的自回归(AR)(如果包含了过程输入,也可以直接从数据中得到ARX模型)。Q统计量是ARX模型的平方预测误差。如果在数据矩阵中包含了足够滞后l,则从一个时刻到下一时刻,Q统计量是统计上独立的,并且阈值(6)在理论上也是合理的。这种把 PCA 应用到式(7)的方法称为动态 PCA(DPCA)。可以用不同滞后时间的自回归模型在训练集中应用来确定滞后l 。滞后l可以通过小样本AIC 准则来选择。T2和Q统计量以及它们的阈值可以直接用于DPCA。

3 应用

田纳西-伊斯曼是由伊斯曼化学公司创建的,其目的是为评价过程控制和监控方法提供一个现实的工业过程。田纳西-伊斯曼过程仿真作为比较各种方法的数据来源,已在过程监控领域得到了广泛的应用。。测试过程

是基于一个真实的工业过程仿真,其中的成分、动力学、运行条件等因为专利权的问题都做了修改。图1是该工业设备的工艺流程图。仿真代码包括21个预设定的故障。

41

沈阳理工大学学士学位论文

Lyman和Georgakis建议为每个故障产生一个闭环过程仿真数据。

训练集和测试集分别为每个故障设置了n =500和n =960个观测值。仿真开始时没有故障,在训练集中故障是在仿真时间1h的时候引入的。在测试集中,故障是在仿真时间8h的时候引入的。所有测量变量和控制变量中除了反应器中的搅拌器的搅拌速度外共用m =52个变量。每个变量的采样间隔为3min。在每次运行之间,都改变随机过程的随机种子来产生故障。21次测试运行产生21个预设定的故障(故障1-21)。而且故障0是在没有故障的情况下发生的。

图2对于故障4,用于故障检测的(D)PCA多变量统计量

多重故障发生在用一时间可能是发生在许多的工业生产过程。检测单一故障的统计量可以直接应用于检测多重故障,因为式(4)和(6)中的阈值是依赖于从正常运作产生的数据的(故障0)。当多个同步故障对过程变量的影响没有消失时,就会被检测出来。检测多重故障具有挑战性,而且该故障诊断统计量的熟练程度取决于多重故障相结合的性质。

除故障3、9和15,所有故障的最小漏检率都在表4中。除CVA的Q统计量,在残差空间的统计量都比在得分或状态空间的统计量要敏感。换句话说,故障经常在过程中创建一个新的状态而不是在受控操作中放大状态。例如故障4,T2和D(PCA)中的Q统计量比T2和(D)PCA中的T2统计量要小。哪种多元统计量对故障4更敏感。

42

沈阳理工大学学士学位论文

4 结论

田纳西-伊斯曼过程仿真在灵敏性、实时性和鲁棒性上对 PCA、DPCA 和CVA 进行比较。这种比较包括一个假定的残差空间 CVA(T2)故障检测统计量。这是首次用 CVA残差空间统计量进行故障检测。

除CVA的Q统计量,对于大多数故障,在残差空间的统计量(CVA-T2PCA Q,和 DPCA Q统计量)比在得分或状态空间的统计量(CVA T2,PCA T2和 DPCA T2统计量)要灵敏。统计量有小的漏检率就会有小的检测延迟,反之亦然。CVA的T2和Q统计量通常表现出最小的检测延迟。

基于原始的阈值,PCA和DPCA的T2统计量的误报率比 DPCA 的Q统计量和CVA 的统计量的误报率要小。CVA缺乏鲁棒性是由于它的统计量对矩阵的逆更敏感。一个应用CVA的T2统计量的重要原因是它的灵敏性和实时性,但是它的阈值必须进行调整,以实现鲁棒性。由于阈值的定义,DPCA和PCA对大多数故障有类似的漏检率。

43

联系客服:779662525#qq.com(#替换为@)