可靠性建模资料整理 下载本文

模型能力指的是软件可靠性模型对给定软件产品的可靠性预测和评价的能力。一般情况下,一个能力强的模型能对以下的可靠性指标进行很好的测量和评价:①当前的可靠性,平均无故障时间(MTTF),或故障密度;②期望达到规定可靠性目标的日期,即期望 MTTF,或故障密度目标的日期;③与达到规定目标有关的人力和计算机资源以及成本要求。

4)简捷性

模型简捷性主要体现在以下三个方面:①模型所需要的数据收集简单并且经济代价低;②模型概念简单直观。只有做到概念简单直观,软件工程师们才能清楚的判定在什么情况下模型是可用的,什么情况下模型已脱离了工程实用性;③模型参数解释清楚,这样软件工程师们在数据不充足的情况下,对参数的估计才具有可行性。同时,模型所包含参数个数应该是尽量的少。

(5)模型假设质量

软件可靠性模型的建立是基于一定的假设条件的,应该从逻辑正确性及软件工程师的经验等方面考查假设的合理性和显然成立的程度。 3.2 软件可靠性建模流程

为了满足软件可靠性指标要求,需要对软件进行测试-可靠性分析 - 再测试-再分析-修改的循环过程。软件可靠性建模的目标是为了对软件中失效趋势和可靠性进行有效预测,来判断软件是否达到发布要求。软件可靠性模型的建模过程如下图:

软件失效数据收集数学模型建立模型参数估计得到拟合模型N获得性能度量的估计Y获得性能度量的估计判断 (1)软件失效数据收集

软件失效数据是进行软件可靠性分析和预测的基础,收集到的软件失效数据质量好坏直接影响到模型预测的准确性。在失效数据收集前需要对时间和数据做如下解释:

关于时间,在软件可靠性模型研究中,一般都把时间大致分成了两类,即日历时间和执行时间。尽管 Musa 模型坚持认为只有对执行时间进行测量才是唯一有效的,但是根据实际经验,对软件运行时间的测量,并非非执行时间不可,而且执行时间需要操作系统得出,这无疑增加了软件失效数据收集的难度和工作量。相比之下,日历时间具有很大的灵活性及优势,它便于测量记录,而且不会影响到后续的分析。因此在本文模型中,失效时间记录采用的是日历时间。

关于数据,软件失效数据可分为完全数据和非完全数据两类。它们的定义是: 若??? ???? 1,2,….,?? →?? ?? ??? ???1 =1 ,那么数据集合 ?? ?? |?? 0 =0,??=0,1,2,…?? 为完全数据集合;

若??? ???? 1,2,….,?? →?? ?? ??? ???1 >1 ,那么数据集合 ?? ?? |?? 0 =0,??=0,1,2,…?? 为非完全数据集合,其中y(i)是时间t(i)时刻的累计故障数。由上述定义可知完全数据即故障时间间隔数据,非完全数据便为各个时间间隔内的累计故障数据。

失效数据的收集具体包括:故障发生时间、相邻故障的间隔时间、各个时间间隔内的累计故障数。失效数据收集完成后,可画出软件故障数随时间变化的散点图或直方图。

(2)数学模型建立

通过分析收集得到的软件失效数据提出合理假设,依据这些假设列出数学表达式,建立软件可靠性模型。

(3)模型参数估计

在使用模型进行软件可靠性分析前,需要先求出模型中未知参数的估计值。常用的参数估计方法有:最大似然估计法、最小二乘法、贝叶斯估计法等。

(4)得到拟合模型

求出模型中未知参数的估计值后就可以建立拟合模型,可通过Matlab工具画出拟合曲线,拟合效果取决于软件失效数据质量及所选用的模型形式。

(5)拟合效果测试

通过测试来检查所获得的模型是否与实测数据拟合?如能很好拟合,就说明拟合模型可很好的描述所观察的故障情况。则可仅需进行下一步。若不拟合,就必须检查或重新选择更恰当的模型。

(6)获得性能度量的估计

通过此步骤可对包括软件可靠性在内软件系统的性能作出定量的度量; (7)做出判定

通过判定以确定系统是否需要继续进行测试,是否可以交付使用。

3.3 常见参数估计方法

1 最小二乘法

最小二乘法作为一种数学优化技术,是通过最小化误差的平方和来寻找数据的最佳函数匹配。利用最小二乘法,可以简便地求得未知数据,使得这些数据与实际数据间误差的平方和为最小。

设有随机变量Y 由 k个参数

和 k个变量

组成,并且

根据数据可对 k个参数进行估计。求

的最小二乘估计就是寻找一组令结果等于零,可得:以

,使得:其中,。那么,称

的值最小。对其求导并记

,,可即

的一致最小二乘无偏估计。

最大似然估计法

最大似然估计法,也叫极大似然法,是最为常用的经典统计方法。它最早由德国大数学家 C.F. Gauss 提出,1912 年,英国统计学家R·A·Fisher 在其一篇文章中重新提出,并且证明了最大似然估计法的一些性质。

最大似然估计法的基本思想是:由样本值选择参数,使得该样本发生的概率最大。具体做法如下:设总体X 概率密度函数为?

,其中

为未知参数,

为来自总体X 的一个给定的子样,则似然函数:

为参数θ的函数。求数

的最大似然估计值。

最大似然估计的求法包括以下步骤:

(1) 根据总体分布导出样本联合密度(或联合概率函数);

(2) 将样本联合密度(或联合概率函数)中的参数θ看作自变量,自变量看成已知常

数,得到似然函数(3) 通常对似然函数

做对数变换得到

,求得

的最大值点,

使似然函数

的值达到最大,

为参

即θ的最大似然估计;

(4) 在最大值点的表达式中将样本值代入即可得到参数的极大似然估计值。 贝耶斯估计

由贝耶斯统计学理论可知,对总体的特征数进行推断时,除了使用到总体信息和样本信息外,还应该使用到先验信息,即抽样(试验)之前有关统计问题的一些信息。 (1)先验分布

将总体中的未知参数记为

看成一取值于参数空间?的随机变量,它有一概率分布,

,称为参数θ的先验分布。当θ是参数空间?上的连续型随机变量时,称θ

的密度函数为先验密度。 (2)后验分布

在贝耶斯统计学中,把总体信息、样本信息及先验信息归纳起来的最好形式是在总体分布基础上获得的样本

和参数θ的联合密度函数:

,在这个联合密度函数中,当样本给定之后,未

知的仅是参数θ了,我们关心的是样本给定后,θ的条件密度函数,依据密度的计算公式,容

这就是贝耶斯公式的

密度函数形式,

称为θ的后验密度函数,或后验分布。其中,

称为样本的边际分布,或称样本的无条件分布,

它的积分区域就是参数θ的取值范围,根据具体情况而定。

归纳起来贝耶斯估计法的过程为,人们根据先验信息对参数θ已有一个认识,这个认识就是先验分布

。然后通过试验,获得样本,从而对θ的先验分布进行调整,调整

后验分

的方法就是使用上面的贝耶斯公式,调整的结果就是后验分布

布是总体信息、样本信息及先验信息这三种信息的综合。获得后验分布使人们对θ的认识又前进一步,可以看出,获得样本的的效果是把我们对θ的认识由

所以对θ的统计推断就应建立在后验分布

调整到

的基础上。