沈阳理工大学学士学位论文
元分析提取少数几个能体现原过程绝大多数信息的新变量,通过监视新变量的变化来判断生产过程运行是否正常,主元分析在故障诊断中得到了较好的应用。由于主元分析主要用来分析过程变量问线性、稳态关系,它在复杂过程系统的应用受到了一定的限制。
研究学者针对这些局限性提出了一些改善方法,如:Barkshi结合小波分析能有效消除变量的自相关性、主元分析能消除变量间的互相关性的特点,提出了多尺度主元分析(Multi. scale PCA)来提高常规PCA在时-频域的局部分析能力
[2]
;以及非线性主元分
析(Nonlinear PCA)结合神经网络来提高处理非线性的能力,进一步改善了常规PCA难于处理测量变量间非线性关系的局限;分块主元分析(Multi. block PCA)将大规模过程分成若干个子过程,针对各个子过程分别进行主元分析,从而改善了常规PCA在处理大系统过程的分析精度;多向主元分析(Multi. way PCA)用来处理批次过程。除此之外还有:动态主元分析(Dynamic PCA)用来改善常规PCA的动态性能;移动丰元分析(Moving PCA)通过分析各个主元方向的变化程度,改善常规PCA的过程监测性能等。
经过近70年在全世界范围的实践,统计过程控制获得了长足的发展,其与计算机技术的结合日益紧密,在过程工业中已经得到了广泛的应用。但是由于连续生产过程的特点及其相关处理的复杂性,使得多变量统计过程控制无论在理论方法或是实际应用方面中,都还有许多的问题有待研究解决。 1.2.2 基于主元分析的故障诊断技术发展趋势
就基于主元分析(PCA)的故障诊断方法而言,首先对生产过程中采集到的正常数据进行主元分析,建立主元模型,然后将过程中新得到的数据向量投影到两个正交的子空间(主元子空间和残差子空间)上,并分别在相应空间上使用Hotelling统计量和甲方预测误差SPE统计量,来进行假设检验,如果检验到数据偏离正常统计模型,就可以判断有故障发生,然后可以借助贡献图分析每个过程变量对SPE统计量和T2统计量的贡献大小,确定是哪些过程变量引起了过程变化或故障,根据以前积累的工程经验,来判断故障原因。
标准多元统计分析的PCA方法在其推导过程中,作了如下假定:(1)各个变量都服从高斯正态分布;(2)过程处于稳态,不存在序列相关性;(3)过程参数不随时问变化;(4)过程是线性的
[16]
。以上假设限制了PCA在实际过程中的应用,导致大量的错报和误报。
因此针对PCA的上述假定,不少学者提出了各种PCA的改进算法。
4
沈阳理工大学学士学位论文
(1)动态方面的改进
标准PCA是以“样本观测相互独立”作为假设前提条件,没有考虑到时间序列相关性的影响,因此标准PCA从其本质上说,是一种静态建模技术。对于大多数工业过程而言,都存在动态特性,测量变量并不是序列无关的,当前时刻的测量变量与过去若干时刻的测量变量都有关系。为此,探讨适合序列相关数据的动态PCA方法是非常必要的。动态PCA建模是在原来时间序列数据块的基础上对每个变量进行增广,在增广矩阵基础上建模。由学者将PCA和时间序列模型ARMAX相结合提出了动态主元分析DPCA,有效的去除了测量变量时间序列的自相关关系。DPCA模型与传统PCA方法相比较,去除相关性能力更强。动态PCA和静态PCA在故障诊断中的实际应用表明在动态系统,动态PCA方法的效果明显优于静态PCA方法。动态主元分析DPCA虽然较好地解决了数据的动态性问题,但仍是一种线性化的建模方法。
(2)非线性方面的改进
多元统计分析方法作为一种线性化的技术,在提取大型复杂、非线性系统主元特征时存在以下两个问题:(1)线性分解方法压缩和提取不充分;(2)线性方法监视结果不可靠。这是由于较小的主元中可能包含重要的非线性信息,如果舍弃该主元,会导致重要信息的丢失;如果保留该主元,会造成模型复杂。所以有必要使用非线性技术提取大型复杂系统非线性统计特征。
常用的非线性多元统计分析方法有以下几种:
①广义PCA:该方法由Gnanadesikian提出,其基本思想是将m维原始向量进行扩充,使新向量包含某些成员变量的非线性函数,然后对这个增广的新向量进行线性主元分析。但是,由于事先并不确切知道变量间存在什么样的非线性函数关系,因此该方法难以在实际中得到很好的应用。
②主元曲线方法:1989年,Hastie和Stuetzle提出了主元曲线和主元曲面(Principal Curve&Principal Surface)的概念,所谓主元曲线,实际上是通过对样本数据进行非线性特征提取而得到的一条光滑曲线,曲线的形状由数据的结构所决定,当曲线为直线时,即为线性PCA的主元曲线,Hastie等给出了主元曲线的近似求解算法,由于该方法计算复杂,因此这种非线性主元还不易于实际使用。
③神经网络PCA方法:在主元分析基础上融入神经网络方法是解决多元统计分析方法线性化问题的另一有效途径。Kramer提出一种自联想神经网络(Autoassociate Neural Network)结构来处理非线性主元分析。这种自联想神经网络的缺点在于,当神经网络隐
5
沈阳理工大学学士学位论文
层数较多时,学习训练能力下降。1995年,Tan和Mavrovouniotis提出用输入训练(Input Training,简称IT)神经网络进行非线性主元分析。IT神经网络特点在于神经网络输入没有给出,学习样本只有输出数据,所以其内部权值和输入都需要学习调整。
(3)自适应方法
在实际工业生产中,由于原料性质的改变、外界环境的变化、过程负荷的改变、设备的磨损等因素,导致工业过程的操作条件是多变的,但是传统的多变量统计方法假定在所考虑的时间尺度上,数据都是静态不变的。所以,有必要对传统的算法做进一步改进以克服系统的非静态特性,以达到自动调整诊断模型,实现故障诊断的准确性和实时性。系统的漂移可以分成两种情况,一种是变量的均值和方差发生了变化,而变量之间的定性关系仍保持不变,第二种情况是除了均值和方差发生变化之外,变量之间的关系也发生了变化。在第一种情况下,Rosen和Lennox提出通过更新数据的归一化参数的方法来适应均值和方差的变化比。第二种情况比第一种情况要复杂一些,Dayal和MacGregor,Qin等采用了递归的方法。这些基于递归的方法的基本原理是将新的测量数据以一定的权值包含到待处理的数据矩阵中,这些权值一般是指数减小的,也就是说,随着过程的进行,历史数据对当前数据矩阵的影响是逐渐减小的,当前时刻的数据具有最大的权值,而离当前时刻越远的时刻的数据具有越小的权值。基于递归的自适应算法也在一定程度上克服了非线性的影响,因为递归模型可以看成是系统在不同操作点的线性化模型。
(4)多尺度方法
传统的多元统计方法没有考虑到频率特性,即数据信息的提取和压缩都是在同一时间尺度上完成的。PCA方法对测量变量的时间序列进行建模,建模过程中仅仅考虑了采样间隔这一尺度,因此该模型是单尺度的。单尺度模型仅适合于在一个时间尺度上有贡献的数据。但是由于多种原因,在单一尺度上建立的模型对于某些尺度上的事件并不灵敏。小波分析为解决多尺度问题提供了可能性。测量信号通过小波分析被分解为不同尺度上的信号,信号的高频信息被包含在高尺度上,而低频信息被包含在低尺度上。Bakshi提出的多尺度PCA( Multiscale PCA,MSPCA),利用小波变换将每一信号分解为多个尺度上的信号,在每一尺度上分别建立相应的模型。
(5)层次和多块主元分析方法
对于大型的化工联合企业而言,每一生产流程都涉及大量的化工装置,总的测量变量个数也极为庞大,因此,在建立统计过程模型时,对模型中变量之间相互关系的解释
6
沈阳理工大学学士学位论文
极为复杂,使模型难以实际应用。一种有效的方法就是建立一种层次模型,将整个装置分为若干等级,每一等级都建立相应的模型。Wangen,Kowalshi和MacGregor等研究者分别阐述了多块或多层次PCA的思想,使模型的解释能力大为增强。层次PCA或多块PCA将数据分层次组织起来,下一等级的得分被用于构造上一等级的PCA模型。每一模型都相对比较简单,与单一的PCA模型相比,这种建模方法具有更好的解释能力,特别是对于流程工业而言,测量数据可能来自同一流程不同的过程装置或过程单元,对每一过程装置或单元的测量数据分别建立相应的统计模型,然后从每一模型中抽取出主元,构建出上面一层的模型。这一思想实质上是一种将大系统层层分解简化的方法,对于最底层的模型而言,由于模型中的测量变量都是来自于同一过程单元,变量之问的相互关系相对比较明确,模型的解释能力比较强。因此,基于层次或多块思想的建模方法相比传统的单一PCA模型,具有更好的解释能力和故障诊断能力。
(6)间歇生产过程的监控方法
以上方法主要应用于连续工业生产过程的故障诊断,作为工业生产中另一种重要的生产方式之一的间歇生产过程,与连续生产过程相比,具有启停频繁、动态特性变化快、时序操作严格、多阶段、有限生产(以批次为周期的生产)等特点,间歇生产过程的故障诊断更为复杂。不同于连续过程的二个维度,其测量数据包括时间、变量、批次三个维度。Nomikos和MacGregor提出了基于复合主元分析(Multiway Principal ComponentAnalysis,MPCA)的过程监控方法。该方法通过将三维矩阵按时间进行切片,展开成二维矩阵,从而利用主元分析对其进行监控。
1.3 本次设计主要工作内容
本文通过查阅相关资料文献,通过对多种故障诊断方法的研究,选取基于主元分析(PCA)的方法作为本文设计故障诊断系统的基础。本文主要研究了基于主元分析的数学原理和实现过程,并使用田纳西--伊斯曼过程TEP (Tennessee Eastman Process)平台产生仿真数据,利用MATLAB软件建立故障检测与诊断模型。通过T2和Q(或SPE)统计量与其阈值的判断,并通过贡献率图对系统进行故障诊断。实验表明,基于PCA的故障诊断方法能够对过程的非正常变化做出反应,也能较正确地找出发生故障的原因以及相应环节。
7