(1)假设检验的基本思想是什么?假设检验一般有哪些步骤? 解: 为判断所作的假设是否正确,从总体中抽取样本,根据样本的取值,依据“小概率原理”作为判断假设的根据,做出接受或拒绝原假设的决策。
总体参数检验的步骤:
① 提出假设
② 决定检验的显著性水平α
③ 构造检验统计量,并依据样本信息计算检验统计量的实际值
④ 将实际求得的检验统计量取值与临界值进行比较,作出拒绝或接受零假设的决策 符号检验法的步骤:
① 配对资料的符号检验
1) 提出原假设与备择假设 2) 计算差值并赋予符号 3) 统计推断
② 样本中位数与总体中位数比较的符号检验
1) 提出原假设与备择假设
2) 计算差值、确定符号及其个数 3) 统计推断
秩和检验法的步骤:
① 配对试验资料的符号秩和检验(Wilcoxon配对法)
1) 提出原假设与备择假设 2) 编秩次、定符号 3) 确定统计量T 4) 统计推断
② 非配对试验资料的秩和检验(Wilcoxon非配对法)
5) 提出原假设与备择假设
6) 求两个样本合并数据的秩次 7) 确定统计量T 8) 统计推断
(2)区间估计与假设检验有何联系与区别?如何根据置信区间进行假设检验? 解: 联系:
① 需要根据样本寻找合适的统计量,要求统计量的分布已知,而且可以通过样本算出具体的值。 ② 要根据小概率原理构造小概率事件。
③ 区间估计确定在一定的概率保证程度下的接受域,而假设检验确定在一定的置信水平下统计量是否落在拒绝域内。
区别: ① 参数估计解决的是多少(或范围)问题,假设检验则判断结论是否成立。前者解决的是定量问题,后者解决的是定性问题。 ② 两者的要求各不相同,区间估计确定在一定概率保证程度下给出未知参数的范围;而假设检验确定在一定的置信水平下,未知参数能否接受已给定的值。 ③ 两者对问题的了解程度各不相同.进行区间估计之前不了解未知参数的有关信息,而假设检验对未知参数的信息有所了解,但做出某种判断无确切把握。
利用置信区间进行假设检验参见假设检验的步骤。
(3)某旅游机构根据过去资料对国内旅游者的旅游费用进行分析,发现在3日的旅游时间中,旅游者用在车费、住宿费、膳食及购买纪念品等方面的费用是一个近似服从正态分布的随机变量,其平均值为1030
元,标准差为205元。而某研究所抽取了样本容量为400的样本,作了同样内容的调查,得到样本平均数为1250元。若把旅游机构的分析结果看作是对总体参数的一种假设,这种假设能否接受呢? 解: ① 按题意提出假设
H0:?=?0=1030 H1:???0
② 取?=0.05,则z?/2=z0.025=1.96 ③ 构造统计量
Z?x??0~N(0,1)
?/n ④ ?z?=
1250?1030=21.46>1.96,所以拒绝原假设,不能用旅游机构的分析结果对总体参数进行
205/20假设。
(4)一种电子元件,要求其使用寿命不得低于1000小时。已知这种元件的使用寿命服从标准差为90小时的正态分布。现从一批元件中随机抽取25件,测得平均使用寿命为957小时。试在0.01的显著性水平下,确定这批元件是否合格。 解:
① 按题意提出假设
H0:???0=1000 H1:?0
② 取?=0.01,则z?/2=z0.005=2.58 ③ 构造统计量
Z?x??0~N(0,1)
?/n ④ ?z?=
957?1000=2.39<2.58,所以接受原假设,这批元件合格。
90/5(5)什么是原假设?什么叫备择假设? 解: 对于假设检验问题,首先需要提出一个统计假设,记为H0,称为原假设,另一个记为H1,称为备择假设。对于问题中哪个作为原假设,哪个作为备择假设需要根据具体情况而定。一般来说,如果我们希望通过样本支持某种假设,就把它作为备择假设而把该陈述的否定假设作为原假设,即通过否定打算肯定的对立面来达到肯定。两种假设是互相排斥且完备。
(6)某小区全部业主中,晚报的订阅率服从正态分布(0.4,1),最近从订阅率来看似乎出现减少的现象,随机抽200户家庭进行调查,有76户业主订阅该报纸,问报纸的订阅率是否显著降低(α=0.05)? 解:
由题意可知,订阅率无明显变化的范围是[0.4-1.96,0.4+1.96],即[-1.56,2.36]。而最近的订阅率为76/200=0.38?[-1.56,2.36],所以,订阅率没有明显降低。
(7)某型号的汽车轮胎耐用里程服从正态分布,其平均耐用里程为25000公里。现在从某厂生产的轮胎随机取6个进行里程测试,结果数据如下:
25600 25300 24900 24800 25000 25200
根据以上数据检验该厂轮胎的耐用里程是否存在显著性的差异(α=0.05)?
解:
按题意需检验
H0:?=?0=25000 H1:???0
取?=0.05,建立统计量
T=
x??0~t?(n-1)
s/n由已知,n=6,t0.05(5)=2.0150,经计算得样本均值x=30160,样本标准差s=158.5,则 t=72.8>2.105,所以拒绝原假设,该厂轮胎的耐用里程存在显著性的差异。
(8)某洗衣粉生产厂用自动包装机装袋,每袋的标准量为500g,每天每隔三个小时需要定时检查包装机的工作是否正常。根据以往的资料采用包装机装箱,每箱量的标准差σ为1.12g。某日开机三小时后,随机抽取了12箱,测得量(单位:g)数据见表4-2。在5%的显著性水平下,推断该包装机的工作是否正常稳定。
所测试的12箱洗衣粉的量 单位:g
497 497.5
解:
① 操作步骤
第一步,添加分析变量。
第二步,在Test Value中输入总体均值500。
498.1 498.5
501.9 502.8
499.8 500.2
497.9 499.6
501.3 502.7
② 结果分析
Table 1 One-Sample Statistics 重量 N Mean 12 4.9978E2 Std. Deviation 2.03565 Std. Error Mean .58764 由Table 1可知,样本均值Mean为4.9978E2。 Table 2 One-Sample Test 重量 t -.383 df 11 Test Value = 500
95% Confidence Interval of the Difference Sig. (2-tailed) Mean Difference .709 -.22500 Lower -1.5184 Upper 1.0684 由Table 2可知,显著性概率p等于0.709,大于0.05,因此认为包装机工作稳定。
(9)某国际汽车调查机构对产地为美国、欧洲及日本的汽车做了一个抽样调查,数据涵盖了1升油能行驶的里程数(英里)、车的马力、整车净重、从静止加速到60迈的时间(秒),
里程数
马力
车重
加速时间
产地
里程数
马力
车重
加速时间
产地
29 21 25 27 30 26 25 28 26 24 18 17 26 25 24 25 26 28 30 30
52 72 60 72 80 96 88 90 88 90 129 138 46 87 90 95 113 90 70 76
2035 2401 2164 2565 2155 2300 2740 2678 2870 3003 3725 3955 1835 2672 2430 2375 2234 2123 2074 2065
22 20 22 14 15 16 16 17 18 20 13 13 21 18 15 18 13 14 20 15
美国 美国 美国 美国 美国 美国 美国 美国 美国 美国 美国 美国 欧洲 欧洲 欧洲 欧洲 欧洲 欧洲 欧洲 欧洲
44 20 25 36 17 17 16 31 19 18 22 24 31 35 24 28 23 27 20 22
52 103 77 67 120 125 133 76 97 90 110 100 65 69 95 92 97 88 88 83
2130 2830 3530 2950 3820 3140 3410 3160 2330 2124 2720 2420 1773 1613 2278 2288 2506 2100 2279 2062
25 16 20 20 17 14 16 20 14 14 14 13 19 18 16 17 15 17 19 15
欧洲 欧洲 欧洲 欧洲 欧洲 欧洲 欧洲 欧洲 日本 日本 日本 日本 日本 日本 日本 日本 日本 日本 日本 日本
① 产地分别为“日本”和“欧洲”的汽车,其汽车提速时间的长短上有无显著差异?
② 汽车提速时间是否服从正态分布?是否服从均匀分布? 解:
①
第一步,将加速时间及其对应产地输入数据编辑窗口,选择Compare Means中的Independent-Samples T Test...。
第二步,将加速时间输入Test Variable(s),将产地输入Grouping Variable,并在Group1中输入日本,Group2中输入欧洲。
结果显示如下。
Table 3 Independent Samples Test 加速 时间 Levene's Test for Equality of Variances t-test for Equality of Means 95% Confidence Interval of the Difference Upper .483 .354 Equal variances assumed Equal variances not assumed F 2.452 Sig. t df 26 Sig. Mean Std. Error (2-tailed) Difference Difference Lower .121 .100 -1.708 -1.708 1.066 1.002 .129 -1.602 -3.900 -3.770 -1.705 25.500 F的显著性概率p=0.129<0.05表明方差齐性成立,所以观察T检验的值,应该采用上一行的结果(Equal variances assumed)。此时t统计量的显著性(双尾)概率p=0.121>0.05,所以,产地分别为“日本”和“欧洲”的汽车,在提速时间的长短上有显著差异。
②
第一步,将加速时间及其对应产地输入数据编辑窗口,选择Nonparametric Tests中子菜单项的“1-sample K-S…”选项。
第二步,在Test variable列表框中输入加速时间,在Test Distribution方框中选择Normal和Uniform。
结果显示如下。
Table 4 One-Sample Kolmogorov-Smirnov Test N Normal Parameters a 加速时间 40 Mean Std. Deviation 16.98 2.948 .130 .130 -.098 .819 .513 Most Extreme Differences Absolute Positive Negative Kolmogorov-Smirnov Z Asymp. Sig. (2-tailed) a. Test distribution is Normal. 由Table4可知,汽车提速时间不服从正态分布。 Table5 One-Sample Kolmogorov-Smirnov Test 2 N Uniform Parameters a 加速时间 40 Minimum Maximum 13 25 .317 .317 -.025 2.003 .001 Most Extreme Differences Absolute Positive Negative Kolmogorov-Smirnov Z Asymp. Sig. (2-tailed) a. Test distribution is Uniform. 由Table5可知,汽车提速时间服从均匀分布。