统计学经典真题及答案2003-2010 下载本文

?(t,s)?cov(Xt,Xs)?E(XtXs)?E(Xt)E(Xs) ?E(XtXs)??A2cos(?t??)cos(?t??)???1d?2?1?A2 ?[cos(?t??s)?cos(?t??t?2?)]d?

2????2?1A2A2 ?[cos(?(t?s))?sin(?t??s?2?)]??2?24A2 ?cos(?(t?s))4?即协方差函数只与t?s有关。

由平稳过程的定义知,题中所定义的过程为平稳过程。

四、1.先来估计各层总体的方差。在比例估计中定义

?1, 第i个单元具有所考虑的特征 Yi?? (i?1,2,...,N)0, 其它?则可得如下关于总体方差的式子

N1N1NN222(Y?Y)?[Y?N(Y)]?Y(1?Y)?PQ S??i?iN?1i?1N?1i?1N?1N?12从上式我们可以估计出各层的方差

s12?N1p1(1?p1)?0.5?0.5?0.25, s1?0.5 N1?1N2p2(1?p2)?0.7?0.3?0.21, s2?0.4583 N2?1N3p3(1?p3)?0.6?0.4?0.24, s3?0.4899 N3?1Nk

。) Nk?1

2s2?2s3?(由于Nk很大,故省略系数

2.考虑样本容量为600的简单随机抽样的方差。在简单随机抽样下总体比例的估计量为

p?估计量方差的估计值为

300?0.5?180?0.7?120?0.6?0.58

6001?fpq0.58?0.42pq???0.0004067n?1n?1599

'v(p)?

3.考虑奈曼分配的情形。设抽取的样本容量为n,样本量在各层的分配公式为

nh?n'WhSh?WShh?1L

h

17

代入数据得到

0.5?0.5n'?0.5149n'

0.25?0.3?0.4583?0.2?0.48990.3?0.4583n2?n'?0.2832n'

0.25?0.3?0.4583?0.2?0.48990.2?0.4899n3?n'?0.2019n'

0.25?0.3?0.4583?0.2?0.4899n1?则奈曼分配的估计量方差的估计为

Lphqhpqv(pst)??Wh(1?fh)??Wh2hhnh?1h?1nh?1h?12L0.250.210.24 ?0.09??0.04?'''0.5149n?10.2832n?10.2019n?10.06250.01890.00960.2356 ????0.5149n'?10.2832n'?10.2019n'?1n' ?0.25?4.计算n'。要使奈曼分层抽样与简单随机抽样有相同估计量方差,则必须满足

v(p)?v(pst)

解得

n?579

五、略。

六、1.来看?t的性质

'0.2356?0.0004067 n'E(?t)?0

var(?t)?E(?t2)?[E(?t)]2??2xt2

cov(?t,?s)?E(?t?s)?E(?t)E(?s)?0(t?s)

由上可看出,该模型违背古典线性回归模型的方差一致性假设,残差存在异方差性。

2.加权最小二乘法。当残差存在异方差时,如果还是用最小二乘法估计参数,会带来严重的后果,如下

①参数估计值虽是无偏的,但不是最小方差线性无偏估计; ②参数的显著性检验失效;

③回归方差的应用效果极不理想。

鉴于此,我们必须寻求适当的方法对原来的估计方法进行变换,使变换后的估计方法满足同方差性假设。由于异方差性导致离差平方和

18

Q(?0,?1)??(yi?E(yi))2i?1n

中的各项的比重不一样,地位不平等,导致使用普通最小二乘法时,回归线就被拉向方差大的项。而在此题中,残差系列与自变量观测值的平方成正比,即

var(?t)??2xt2

2因此当我们在平方和各项前面加入一个权重wi?1/xi时,各项的地位就平等了。从而克服了普通

最小二乘法的弊端,这就是加权最小二乘法。它实施起来简单,原理清晰,是解决本题最好的方法。

七、1.数据分析。在本题中有三个影响因素:时间、活动空间、安眠药。因变量是老鼠的活动状态,可以

把它看成数值型变量。要研究的是时间、活动空间、安眠药对老鼠活动状态是否有显著的影响。我的分析思路是:

首先,我把数据列成如下的表格

吃药后立即记录的数据

关在一起 分开喂养 吃药 不吃药 x11j x21j x12j x22j 吃药后一小时记录的数据 关在一起 分开喂养 吃药 不吃药 y11j y21j y12j y22j

吃药后两小时记录的数据 关在一起 分开喂养 吃药 不吃药 z11j z21j z12j z22j 其中j?1,2,...,10表示老鼠的编号,每个组有10只老鼠。x, y, z代表时间。

其次,对每个表格的数据进行有交互作用的方差分析,通过分析得到活动空间、安眠药是否对老鼠活动状态有显著的影响,也可得到它们的交互作用是否对老鼠活动状态有显著的影响。通过在三个观测时间上各自的分析,最后得到安眠药在那个时间点上的效果最好。 2.分析步骤。(和第八题的步骤差不多,这里就不写了。)

注:上述问题属于有重复测量的方差分析问题,它与一般方差分析的不同之处在于它的时间观测值数据之间不是独立的、是相关的。这里将时间分开来处理,似乎有所不妥,特此说明,仅供参考。

19

八、1.本题中职称和性别都是属性变量,满意度是数值型变量,要研究属性变量对数值型的影响,很自然

会想到用方差分析方法,而本题中我们用无交互作用的双因素方差分析方法。

①问题提出:在分析一个属性变量对一个数值型变量的影响时,我们把属性变量的各个水平各看成一个总体,然后比较这几个总体的均值,看它们是否有显著的差异,如果有显著的差异,则说明在各个水平下得到的数据之间是有差异的,即认为属性变量对数值型变量有显著影响。在本题中,比如我们要研究性别对满意度有无显著影响,我们的思路是把男、女两个水平各看成一个总体,然后根据数据设计一种方法检验它们的均值有无显著的差异,如果没有差异,那么我们认为两总体间的数据没有什么区别,即满意度差异不大,也即性别对满意度没有影响。 ②基本思想:在方差分析中我们假定因素的各个水平服从方差相等正态分布,这样在每个总体下抽取样本,由于抽样的随机性,会导致数据的不同,且各水平之间数据也会不同,我们现在要研究的各水平数据的差异性能完全由抽样的随机性解释吗?如果可以,我们认为个水平均值没有差异;否则,就有差异。具体的做法是,我们引进组内误差和组间误差两个概念,它们分别用组内平方和与组间平方和诠释。如果组间平方和与组内平方和经过平均后的数值相接近,则说明数据间的差异是由抽样的随机性引起的,不存在系统性差异,即属性变量对数值型变量没有影响。 ③分析步骤 a.提出假设

??H0:?1??2, 性别对满意度没有影响行因素假设??

??H1:?1??2?????性别对满意度有影响??H0:?1??2??3?????职称对满意度没有影响列因素假设??

H:?,?,?不全相等?????职称对满意度有影响??1123b.构造检验的统计量

总误差平方和 SST?kr??(xi?1j?1kij?x)2

行因素误差平方和SSR???(xi?1j?1krri??x)2,均方误差 MSR?SSR k?1SSC r?1列因素误差平方和SSC???(x?j?x)2,均方误差 MSC?i?1j?1剩余因素误差平方和SSE?SST?SSR?SSC,均方误差 MSE?F统计量 FR?SSE

(k?1)(r?1)MSRMSC~F(k?1,(k?1)(r?1)), FC?~F(r?1,(k?1)(r?1)) MSEMSEc.统计决策。给定显著性水平?,如果FR?F?,则拒绝原假设,说明行因素对观测值有显著的影响;如果FC?F?,则拒绝原假设,说明列因素对观测值有显著的影响。

2.假定:①各个水平对应的总体都服从正态分布;

20