数学建模方法详解--三十四种常用算法 下载本文

因为ak(k=0,1,?,n)是正规方程组(4)的解,所以满足式(2),因此有

??Q(x)?y????p2niii?0i?0mmn(xi)?yi??02

故pn(x)为最小二乘拟合多项式。

*四 多项式拟合中克服正规方程组的病态

在多项式拟合中,当拟合多项式的次数较高时,其正规方程组往往是病态的。而且

①正规方程组系数矩阵的阶数越高,病态越严重;

②拟合节点分布的区间?x0,xm?偏离原点越远,病态越严重; ③xi(i=0,1,?,m)的数量级相差越大,病态越严重。 为了克服以上缺点,一般采用以下措施:

①尽量少作高次拟合多项式,而作不同的分段低次拟合;

②不使用原始节点作拟合,将节点分布区间作平移,使新的节点xi关于原 点对称,可大大降低正规方程组的条件数,从而减低病态程度。 平移公式为:

x?xmxi?xi?0,i?0,1,?,m2 (9) ③对平移后的节点xi(i=0,1,?,m),再作压缩或扩张处理:

xi??pxi,p?2r(m?1)其中

i?0,1,?,m (10) ,(r是拟合次数) (11)

?(x)ii?0m2r?xi经过这样调整可以使的数量级不太大也不太小,特别对于等距节点

xi?x0?ih(i?0,1,?,m),作式(10)和式(11)两项变换后,其正规方程

组的系数矩阵设 为A,则对1~4次多项式拟合,条件数都不太大,都可以得到满意的结果。

变换后的条件数上限表如下: 拟合次数 1 2 3 4 =1 <9.9 <50.3 <435 cond2(A) ④在实际应用中还可以利用正交多项式求拟合多项式。一种方法是构造离散正交多项式;另一种方法是利用切比雪夫节点求出函数值后再使用正交多项式。这两种方法都使正规方程 组的系数矩阵为对角矩阵,从而避免了正规方程组的病态。我们只介绍第一种,见第三节。 例如 m=19,x0=328,h=1, x1=x0+ih,i=0,1,?,19,即节点 分布在[328,347],作二次多项式拟合时

① 直接用xi构造正规方程组系数矩阵A0,计算可得

cond2(A0)?2.25?1016

严重病态,拟合结果完全不能用。 ② 作平移变换

328?347xi?xi?,i?0,1,?,192

xi构造正规方程组系数矩阵A1,计算可得

cond2(A1)?4.483868?1016

比cond2(A0)降低了13个数量级,病态显著改善,拟合效果较好。

③ 取压缩因子

p?420?(x)ii?019?0.14984

i?0,1,?,19 作压缩变换

?xi用构造正规方程组系数矩阵A2,计算可得

xi??pxi,cond2(A2)?6.839

又比cond2(A1)降低了3个数量级,是良态的方程组,拟合效果十分理想。

?p(x如有必要,在得到的拟合多项式n)中使用原来节点所对应的变量x,可写为

x0?xm))2

仍为一个关于x的n次多项式,正是我们要求的拟合多项式。

五、回归分析(略) Qn(x)?pn(p?(x?六、概率分布方法(略) 七、插值与拟合(略)

八、方差分析法

一)、方差分析的意义

前述的t检验和u检验适用于两个样本均数的比较,对于k个样本均数的比较,如果仍用

t检验或u检验,需比较

次,如四个样本均数需比较次。假设每次比较所确定的检验水准=0.05,则每次检验拒绝H0不犯第一类错误的概率为1-0.05=0.95;那么6次检验都不犯第一类错误的概率为(1-0.05)6=0.7351,而犯第一类错误的概率为0.2649,因而t检验和u检验不适用于多个样本均数的比较。用方差分析比较多个样本均数,可有效地控制第一类错误。方差分析(analysis of variance,ANOVA)由英国统计学家R.A.Fisher首先提出,以F命名其统计量,故方差分析又称F检验。

二)、方差分析的基本思想

下面通过表5.1资料介绍方差分析的基本思想。

例如,有4组进食高脂饮食的家兔,接受不同处理后,测定其血清肾素血管紧张素转化酶(ACE)浓度(表5.1),试比较四组家兔的血清ACE浓度。

表5.1对照组及各实验组家兔血清ACE浓度(u/ml) 对照组 61.24 58.65 46.79 37.43 66.54 59.27 实验组 A降脂药 B降脂药 C降脂药 82.35 26.23 25.46 56.47 46.87 38.79 61.57 24.36 13.55 48.79 38.54 19.45 62.54 42.16 34.56 60.87 30.33 10.96 20.68 48.23 ) 329.92 372.59 229.17 191.00 1122.68 (6 54.99 6 7 7 26 (N ) 62.10 32.74 27.29 43.18 () 18720.97 23758.12 8088.59 6355.43 56923.11 ( ) 由表5.1可见,26只家兔的血清ACE浓度各不相同,称为总变异;四组家兔的血清ACE浓度均数也各不相同,称为组间变异;即使同一组内部的家兔血清ACE浓度相互间也不相同,称为组内变异。该例的总变异包括组间变异和组内变异两部分,或者说可把总变异分解为组间变异和组内变异。组内变异是由于家兔间的个体差异所致。组间变异可能由两种原因所致,一是抽样误差;二是由于各组家兔所接受的处理不同。正如第四章所述,在抽样研究中抽样误差是不可避免的,故导致组间变异的第一种原因肯定存在;第二种原因是否存在,需通过假设检验

作出推断。假设检验的方法很多,由于该例为多个样本均数的比较,应选用方差分析。

方差分析的检验假设H0为各样本来自均数相等的总体,H1为各总体均数不等或不全相等。若不拒绝H0时,可认为各样本均数间的差异是由于抽样误差所致,而不是由于处理因素的作用所致。理论上,此时的组间变异与组内变异应相等,两者的比值即统计量F为1;由于存在抽样误差,两者往往不恰好相等,但相差不会太大,统计量F应接近于1。若拒绝H0,接受H1时,可认为各样本均数间的差异,不仅是由抽样误差所致,还有处理因素的作用。此时的组间变异远大于组内变异,两者的比值即统计量F明显大于1。在实际应用中,当统计量F值远大于1且大于某界值时,拒绝H0,接受H1,即意味着各样本均数间的差异,不仅是由抽样误差所致,还有处理因素的作用。

(5.1)

方差分析的基本思想是根据研究目的和设计类型,将总变异中的离均差平方和SS及其自由度分别分解成相应的若干部分,然后求各相应部分的变异;再用各部分的变异与组内(或误差)变异进行比较,得出统计量F值;最后根据F值的大小确定P值,作出统计推断。 例如,完全随机设计的方差分析,是将总变异中的离均差平方和SS及其自由度分别分解成组间和组内两部分,SS组间/组间和SS组内/组内分别为组间变异(MS组间)和组内变异(MS组内),两者之比即为统计量F(MS组间/MS组内)。 又如,随机区组设计的方差分析,是将总变异中的离均差平方和SS及其自由度分别分解成处理间、区组间和误差3部分,然后分别求得以上各部分的变异(MS处理、MS 区组和MS误差),进而得出统计量F值(MS处理/MS误差、MS区组/MS误差)。

3、方差分析的计算方法

下面以完全随机设计资料为例,说明各部分变异的计算方法。将N个受试对象随机分为k组,分别接受不同的处理。归纳整理数据的格式、符号见下表:

处理组(i)

1

?

2 ?

3 ? k ? ? ?

? ? ?