2010级SPSS试题 下载本文

一. 单项选择题

1. 多因素方差分析中观测变量总的离差平方和不包括 ( ) A. 多个控制变量单独作用引起的离差平方和 B. 多个控制变量交互作用引起的离差平方和 C. 其它随机因素引起的离差平方和

D. 观测变量的非自然因素引起的离差平方和

2. SPSS默认的字符型变量的对齐方式是 ( ) A. 右对齐 B. 中间对齐 C. 左对齐 D. 以上说法都不对 3. 下列函数分布中,单样本的K-S检验不能将一个变量的实际频数分布与 之比较的是 ( )A. 泊松分布 B. 均匀分布 C. 正态分布 D. 二项分布

4. SPSS中创建数据文件时不能用来作为变量名的是 ( ) A. all B. abc1 C. name D. allby

5. 线性回归分析对回归方程的检验不包括 ( ) A. 拟合优度检验 B. 回归方程的显著性检验 C. 回归系数的显著性检验 D. 回归系数的相关性检验

6. SPSS曲线估计中没有提供的曲线方程有 ( )A. 指数函数 B. 三次多项式 C. 幂函数 D. 三角函数 7. 一个生产罐头食品的公司,某批500瓶罐头的中位数为498g,其含义是

( 变形 )A. 500 瓶罐头的平均含量为每瓶498g B. 500 瓶罐头中,含量为498g的瓶数最多 C. 500 瓶罐头中含量最多的一瓶为498g D. 250 瓶罐头的含量小于等于498g

8. 下列统计量中不属于描述样本数据离散程度的是 ( ) A. 方差 B. 标准差 C. 众数 D. 极差

9. SPSS是一个模块化的软件,其扩充模块不包括 ( ) A. SPSS Statistics Base模块 B. Categories模块 C. Advanced Statistics模块 D. Conjoint模块

10. 在交叉列联表分析中,SPSS提供的相关系数的检验方法不包括 ( A. 卡方统计检验 B. 列联系数 C. V系数 D. S系数 11. 在系统聚类分析中,衡量样本数据与小类、小类与小类之间亲疏程度

的方法不包括 ( ) A. 最短距离法 B. 中间距离法 C. 离差平方和 D. 平均距离法

12. 再信度分析实质是求同一量表在两次测试的相关系数,下列说法中错

误的是 ( ) A. 所测量的特质必须稳定 B. 遗忘和练习的效果相同

C. 两次测试期间被试者对问题的熟悉情况没有差别 D. 以上说法都不正确

13. 时间序列分析中利用转换菜单中的替换缺失值命令对缺失值进行补充 的方法不包括 ( ) A. 序列平均值 B. 临近点均值法 C. 线性插值法 D. 临近点众数法

14. 利用ANOVA 进行大、中、小城市的16岁女性青年的平均身高的比较,结

果给出sig.=0.043,说明 ( ) A. 按照0.05显著性水平,三类城市16岁女性青年的身高没有显著差别 B. 按照0.05显著性水平,三种城市16岁女性青年的身高有显著差异 C. 大城市和中城市16岁女性青年的平均身高没有差别利用 D. 大城市和小城市16岁女性青年的平均身高没有差别利用

15. 做线性回归分析得如下的模型汇总表,则以下说法正确的是 ( )

标准估计的误差 2.44047 .58304 .41783

Durbin-Watson

2.066

模型 1 2 3

R .879(a) .994(b) .997(c)

R 方 .772 .988 .994

调整R方 .755 .986 .993

A. 模型1的拟合程度最好 B. 模型2的拟合程度最好 C. 模型3的拟合程度最好 D. 无法判断

16.关于Recode和Automatic Recode的说法正确的是 ( ) A. 前者的码字可以自己定义 B. 后者的码字可以自己定义 C. 前者的码字不可以自己定义 D. 以上说法都不对

17. SPSS的主要变量类型不包括 ( ) A. 数值型 B. 字符型 C. 日期型 D. 英镑型

18. 下面能检验一个样本服从??2的泊松分布的有 ( ) A. T检验 B. 卡方检验 C. K-S检验 D. 游程检验 19. 利用线性回归分析算得回归方程式: y=80x1-2.53x2+57x3,

以下说法中错误的是 ( ) A. x1、x2 和 x3 三个因素中,x2 是对y 影响最小的因素 B. 在其它因素不变的情况下,x1 增加1个单位,y 增加80个单位 C. x2 和 y 变量为正直线相关

D. x1、x2 和 x3 三个因素均对 y 有显著影响

20. SPSS中无效的变量名有 ( ) A. @a1 B. abc1# C.*home D. cd_1

21. SPSS中的缺失值的替代方式不包括 ( ) A. 用变量的所有非缺失值的均数代替

B. 用缺失值相邻点的非缺失值的中位数代替 C. 用缺失值相邻两点的非缺失值的中点值代替 D. 用线性插值方式确定替代值

22. SPSS的基本运行方式不包括 ( ) A. 程序运行方式 B. Include命令方式 C. 完全窗口菜单运行方式 D. 批处理运行方式

23. 某公司生产的一批10000件产品质量的众数为498g,则 ( ) A. 10000 件产品的平均质量为498g B. 10000 件产品中,质量为498g的件数最多 C. 10000 件产品中质量最大的为498g

D. 10000 件产品中有5000件的质量小于等于498g

24. 下列关于方差、峰度和偏度的说法中错误的是 ( ) A. 方差是所有变量值与平均数偏差平方的平均值 B. 峰度是描述变量所有取值分布形态陡缓程度的统计量 C. 偏度是描述变量所有取值分布对称性的统计量

D. 除了偏度,方差和峰度都可以Analyze菜单的Descriptives计算 25. 关于利用 Sort by 对数据排序的描述错误的有 ( ) A. 排序变量可以是多个 B. 排序变量最多一个

C. 排序变量为多个时先按第一个排序,取值相同的再按第二个排,以此类推 D. 观测个体所有变量的值都变到新位置

26. SPSS作图中,下列不属于条形图的有 ( ) A. 简单条形图 B. 堆栈条形图 C. 复合条形图 D. 差异区域图

27. 关于样本的T检验和非参数检验的说法正确的有 ( ) A. T检验要求样本服从或者近似服从正态分布 B. 非参数检验要求样本服从或者近似服从正态分布 C. 两种检验都要求样本服从或者近似服从正态分布 D. 两种检验都不要求样本服从或者近似服从正态分布

28. SPSS软件的编辑窗口能打开的文件类型有 ( ) A. *.st B. *.doc C. *.xls D. *.mat

29. 两个独立样本的检验若采用cut point(如下图)对分类变量A进行分组,并输入数值3,则分组的结果是 ( )

A. 变量取值大于3的个案为一组,取值小于等于3的为一组 B. 变量取值大于等于3的个案为一组,取值小于3的为一组 C. 变量取值大于3的个案为一组,取值小于3的为一组 D. 以上说法都不对

30. 多个配对样本的非参数检验方法不包括 ( ) A. Friendman检验 B. Kendall′s W检验

C. Cochran′s Q检验 D. Wilcoxon检验

31. 在合并a.sav 和b.sav 为ab.sav( 见下)时,是增加 。 A. 记录 B. 变量 C. 数据 D. 表格

数据表1:a.sav 数据表2:b.sav

学生ID 性别 年龄 学生ID 性别 年龄

1 14 female 5 female 16

2 15 male 6 male 15

3 15 male 7 male 13

32. 对上题的文件合并中,关键变量是 。

A. 学生ID B. 性别 C. 年龄 D. 无关键变量

33. 在一次抽奖活动中,欲从1000名参加活动的人员中随机抽取十位幸运参加者,下列SPSS的过程中可以使用的为 。

A. Select Cases B. Compute C. Rank cases D. Automatic Recode

34. 在对身高所做的探索分析中,不能用来判断身高分布的正态性的图形 是 。

A. 茎叶图 B. 正态概率图 C. 饼图 D. 离散正态概率图 35. 交叉列联表分析中提供的图形分析包括 。 A. 散点图 B. 饼图 C. 条形图 D. 线图 二.双项选择题

1. 下列关于判别分析的说法中正确的是 ( )

A. 判别分析先根据已知类别事物的性质,用某种方法对未知类别的

新事物进行判断以将之归入已知的类别中

B. 按从不同角度提出问题,判别分析的判别方法包括Fisher准则、

Bayes准则和Peter准则

C. 判别分析要求观测变量之间没有显著地相关性且服从正态分布 D. 判别分析要求观测变量和因变量都是连续变量

2. 下面关于相关样本的非参数检验的说法中正确的有 ( )

A. Friendman检验要求数据为两个或更多连续字段 B. Kendall协同系数检验要求数据为两个或更多连续字段 C. Cochran′s Q检验要求数据必须为两个有序字段 D. McNemar检验要求数据为三个分类字段

3. 统计数据的预处理数据的选取方法包括 ( )

A. 使用筛选器变量 B. 随机个案样本 C. 加权平均法 D. 数据重新编码

4. 下面关于创建时间序列变量的方法的说法中正确的是 ( )

A. 季节性差分法产生季节性差分序列

B. 先前移动法产生以当前值之前的相邻值计算的移动平均序列 C. 滞后法产生差分序列

D. 平滑法产生基于提前法计算的平均序列

5. 探索性分析中关于缺失项的设置中错误的是 ( )

A. 按列表排除个案表示去除部分含缺失值的个案后再进行分析 B. 按对排除个案去除当前分析变量中有缺失值的个案及与缺失值有

成对关系的个案

C. 按行表排除个案表示去除所有含缺失值的个案后再进行分析 D. 报告值将分组变量的缺失值单独分为一组,并在频数表中输出 6. 关于相关分析的说法中错误的是 ( ) A. 二元定距变量的相关分析中”Flag significance correlations”表示显示统计检验的相伴概率

B. 偏相关分析中”Exclude cases pairwise” 表示剔除所有具有缺失值的个案后再分析计算

C. 不相似测量的距离分析中的统计量有欧氏距离、Chebychev距离、Block距离、Minkowski距离和Customized距离等

D. 相关系数是衡量变量之间相关程度的一个量值,可以取任何实数 7. 下列关于聚类分析的说法中正确的有 ( ) A. 如果观察值的个数多或文件非常大(通常在100个以上)宜采用快速聚类分析方法

B. 层次聚类分析的R型聚类是对研究对象的观察变量进行分类,使有共 同特征的变量聚在一起

C. 层次聚类分析的Q型聚类的图形结果有输出树形图和输出条形图 D. 快速聚类分析只能产生固定类数的聚类解,类数需要用户事先指定 8. 因子分析的说法中正确的 ( ) A. 因子分析是用少数几个因子来描述许多因素之间的联系,以较少几个 因子反映原资料的大部分信息的统计学方法

B. 因子分析过程中的检验方法有巴特利球形检验、反映像相关矩阵检验 和KMO检验

C. 因子分析的主成因分析法中第一主成因有最小的方差,后续成分可解 释的方差越来越多

D. 因子分析收敛的默认迭代次数为50次

9. 下面关于SPSS的帮助系统的说法中正确的有 ( ) A. Statistics Coach适用于对SPSS完全不熟又急需使用的用户 B. Tutorial适用于刚接触SPSS希望快速学习SPSS操作的用户 C. Syntax Guide适用于初级和中级用户,功能比较强 D. 以上说法都正确

10. 下列关于判别分析的说法中错误的是 ( ) A. 判别分析先根据已知类别事物的性质,用某种方法对未知类别的新事物进行判断以将之归入已知的类别中

B. 判别分析的判别方式包括“Enter independent together”、“Use stepwise method”和“Wilks’ lambda”三种

C. 判别分析中可利用组内或组间离差矩阵对观察值分类

D. 判别分析的组间均值的齐性检验的F值越大,Wilks’Lambda越大,平 均数的差异越大 三.简答题

1.SPSS中数据视图所对应的表格与一般的电子处理软件有什么区别? 答:与一般电子表格处理软件相比,SPSS的“Data View”窗口还有以下一些特

性:

(1)一个列对应一个变量,即每一列代表一个变量(Variable)或一个被观测

量的特征;

(2)行是观测,即每一行代表一个个体、一个观测、一个样品,在SPSS中称

为事件(Case);

(3)单元包含值,即每个单元包括一个观测中的单个变量值;

(4)数据文件是一张长方形的二维表。 2.在SPPS中可以使用哪些方法输入数据? 答:SPSS中输入数据一般有以下三种方式:(1)通过手工录入数据;(2)可以

将其他电子表格软件中的数据整列(行)的复制,然后粘贴到SPSS中;(3)通过读入其他格式文件数据的方式输入数据。 3. 简述SPSS软件数据统计分析过程的主要项目 答:主要数据统计分析项目均在分析菜单中,包括:

基本统计分析 、均值比较与检验、方差分析、相关分析、回归分析、聚类与判别、因子分析、非参数检验。 4. 说明方差分析主要用途

答:方差分析是用于两个及两个以上样本均数差别的显著性检验。由于各种因素的影响,研究所得的数据呈现波动状,造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。方差分析主要用途:

① 均数差别的显著性检验;

② 分离各有关因素并估计其对总变异的作用;

③ 分析因素间的交互作用;

④ 方差齐性检验。

5.一组数据的分布特征可以从哪几个方面进行测度?

答:一组数据的分布特征可以从平均数、中位数、众数、方差、百分位、频数、

峰度、偏度等方面描述。

6.简述众数、中位数和均值的特点及应用场合。

答:均值是总体各单位某一数量标志的平均数。平均数可应用于任何场合,比如

在简单时序

预测中可用一定观察期内预测目标的时间序列的均值作为下一期的预测值。 中位数是指将数据按大小顺序排列起来,形成一个数列,居于数列中间位置的那个数据。

中位数的作用与算术平均数相近,也是作为所研究数据的代表值。在一个等差数列或一个正态分布数列中,中位数就等于算术平均数。 在数列中出现了极端变量值的情况下,用中位数作为代表值要比用算术平均数更好,因为中位数不受极端变量值的影响。

众数是指一组数据中出现次数最多的那个数据。它主要用于定类(品质标志)数据的集中趋势,当然也适用于作为定序(品质标志)数据以及定距和定比(数量标志)数据集中趋势的测度值。

7.如何对两个独立样本进行均值差异检验?

答:对两个独立样本进行均值差异检验需要通过两步来完成:第一,利用F检验

判断两总体的方差是否相同;第二,根据第一步的结果,决定T统计量和自由度计算公式,进而对T检验的结论作出判断。

8.进行多因素方差分析时为什么要将观察变量总的离差平方和分解为3个部

分?

答:因为多因素方差分析不仅需要分析多个控制变量独立作用对观察变量的影

响,还要分析

多个控制变量交互作用对观察变量的影响,及其他随机变量对结果的影响。因此,

它需要将观察变量总的离差平方和分解为3个部分。 9.什么是相关分析?常用的方法有哪些?

答:描述变量之间线性相关程度的强弱,并用适当的统计指标表示出来的过 程为相关分析。常用的方法有二元定距变量的相关分析、二元定序变量的相关分 析、偏相关分析和距离相关分析。

10.说明一元线性回归分析、多元线性回归分析和非线性回归分析的基本概念和 功能?

答:(1)一元线性回归分析,在排除其他影响因素或假定其他影响因素确定 的条件下,分析某一个因素(自变量)是如何影响另一事物(因变量)的过程; (2)多元线性回归分析,在实际问题中,影响因变量的因素往往有多个,研究 在线性相关条件下,两个或两个以上自变量对一个因变量的数量变化关系; (3)非线性回归分析,研究在非线性相关条件下,自变量对因变量的数量变化关

系。

四. 统计分析

1. 对服装销量的一个总体做t检验得到结果如下表:

单样本T检验结果表

Sig. 服装销量(万件) t df (2-tailed) .000 Test Value = 20 Mean Difference 5.9893 95% Confidence Interval of the Difference Lower 3.2603 Upper 8.7184

4.707 14 则抽样服装的销量与20万件 (填“有”或“无”)显著差异。

2. 使用SPSS做因子分析时,为了分析因子对原变量的可解释程度,得到如下的特征值与方差贡献表:

如果在抽取对话框中将基于特征值的选项中将参数设置为0.6,则得到的有效因子的个数为 个。

3. 将数据文件a.sav 和b.sav 合并为一个文件属于 (填“横向合并”或“纵向合并”)。

数据表1:a.sav 数据表2:b.sav

学生ID 性别 1 female 2 male 3 male 年龄 14 15 15

学生ID 科目 1 语文 2 语文 3 语文 成绩 89 67 78 4. 对三种不同的教学方法中学生成绩的协方差分析表如下:

则不同的教学方法对数学成绩 (填“有”或“无” )显著影响。

5. 某公司对员工进行了一次培训,为检验培训效果,随机地从员工中抽出50人,欲将他们培训前后的工作效率进行比较,SPSS中可用 来判断培训前后的效率是否有显著差异。

6. 一元线性回归分析得到如下回归系数表,回归方程可写为 。

模型1(常量)国内生产总值非标准化系数B标准误差-4993.281919.356.197.008标准系数试用版.989t-5.43124.336Sig..000.000

7. 利用Kendall和谐系数判定3个医生对一批病人评价结果的一致性的如下结果:

NKendall Wa卡方df渐近显著性a. Kendall 协同系数。6.96411.5652.003

则三个医生评分结果具有 (填“较差”或“较好”)的一致性。

8. 下表是多重响应交叉分析的频数表,从表中可以看出,各种数码产品中,拥有 的人数最多,拥有数码产品的数量较高的是 。

sex*$dp 交叉制表数码产品a数码相机sex男女总计计数计数计数15924数码摄像机16723MP3221335DVD机13821总计301545百分比和总计以响应者为基础。a. 值为1 时制表的二分组。 9. 为了将某班学生的数学成绩与全国平均成绩比较,做t检验得到结果如下:

则该班学生的数学成绩与全国平均成绩 (填“有”或“无”)显著差异。 10. 做多元线性回归分析时得到回归系数表如下:

则多元线性回归方程 。

11. 使用SPSS做因子分析时,为了分析因子对原变量的可解释程度,得

到如下的Total Variance Explained表格:

如果在 Extraction 选项中将 Eigenvalue over 的参数设置为0.8,则得到的有效的因子的个数为 个。

12. 用SPSS做单因素方差分析得到如下:

则因变量的分组1和分组2的均值 (填“有”或“没有” )显著差异。

13.某种生产浴皂过程的设计规格为每批平均生产120块肥皂。超过或低于这个标准都是不合理的。有10批产品组成的样本中,每批生产的产品数据如下,假定总体服从正态分布。

108 118 120 122 119 113 124 122 120 123

显著性水平为α=0.05,检验该样本结果能否表示该生产过程运作正常?分析结

果如下表所示 One-Sample Test Test Value = 120 Sig. (2-tailed) Mean Difference 95% Confidence Interval of the Difference t df Lower Upper 产品数-.705 9 .498 -1.10000 -4.6280 2.4280 量 请对此结果进行分析和解释。 答:结果显示,t统计量值为-0.705,相应的双尾显著性概率为0.498>0.05,因此没有理由拒绝原假设。故认为据此样本数据推断总体,结果表示该生产过程运作正常。

14.公路损失数据研究机构的伤害和碰撞损失实验报告根据事故后的保险索赔数字对轿车型号进行评分,接近100的指数得分被认为是平均水平,较低的得分意味着更好、更安全的轿车型号。下表所示数据是20款中型轿车和20型小型轿车的得分。 车型 得分 中型轿车 81 91 93 127 68 81 60 51 58 75 100 103 119 82 128 76 68 81 91 82 小型轿车 73 100 127 100 124 103 119 108 109 113 108 118 103 120 102 122 96 133 80 140 分析结果如下表所示

使用独立样本T检验比较中型轿车和小型轿车安全性,请对此结果进行分析和解释。

利用输出结果进行t检验分析如下:

首先进行方差齐性检验,由“Levene’s Test for Equality of Variances两列可知F=1.119,相应的显著性水平概率(Sig)为0.297>0.05,因此没有理由拒绝原假设,可以认为中型轿车与小型轿车得分总体的方差没有显著性差异。其次检验中型轿车和小型轿车的安全得分的值是否有显著性差异。因为方差没有显著性差异,所以看第一行的T检验结果。T=-3.989,相应的双尾显著性概率

(Sig(2-tail))小于0.05,因此,高度显著,即认为中型轿车与小型轿车的安

全得分有显著性差异。

15.一种新型减肥食品正在作投入市场前的检验。一个随机样本有8人组成,在他们服用这种减肥食品前记录下每个人的体重。然后让他们连续服用这种食品一个疗程,再次记录他们的体重,试验结果如下表所示 受试验者 服用减肥食品前的体重/kg 服用减肥食品后的体重/kg 1 75 71.5 2 96 92.5 3 90 85 4 100 96 5 78 73 6 83 79 7 67 66 8 71 71 分析结果如下表所示

请对此结果进行分析和解释。

答:配对的T统计量值为5.071,自由度为7,双尾显著性概率p值0.001 <0.05,故拒绝原假设,可以认为服用减肥食品前后平均体重有显著性差异。

16.下表是五个地区每天发生交通事故的次数(单位:次) 每天发生交通事故的次数 东部 北部 中部 南部 西部 15 12 10 14 13 17 10 14 9 12 14 13 13 7 9 11 17 15 10 14 14 12 8 10 7 9 由于是随机抽样,有一些地区的样本容量较多,而有些地区的样本容量较少。以α=0.05的显著性水平检验各地区平均每天交通事故的次数是否有显著性差异。

分析结果如下表所示

请对此结果进行分析和解释。

答:根据方差齐性检验结果,统计量的值是0.096,第一、第二自由度分别为4、21,相应的显著性概率为0.983,非常大。因此,没有现由拒绝原假设,认为不同地区的交通事故次数的方差没有显著性差异,即方差具有齐性。

由方差分析表可知,F=3.676,其显著性概率=0.02<0.05,故拒绝原假设,认为各地区平均每天交通事故次数有显著性差异。

17.调查不同职业的男性和女性的收入情况,分析作为财务管理、计算机程序员、药剂师等不同职业的男女之间月薪是否有明显差异,为此,从每个职业中分别选取5名男子和5名女子组成样本,样本中每个人的月薪(单位:元)数据如下表所示。

用双因素方差分析法分析职业、性别及其交互作用对月薪的影响。

不同职业的男性和女性的收入 序号 1 2 3 4 5 6 7 月薪/元 3488 3436 4112 4468 4076 2076 2808 职业 性别 序号 8 9 10 11 12 13 14 月薪/元 3536 3060 2740 2800 2684 4420 4576 职业 程序员 程序员 程序员 程序员 程序员 药剂师 药剂师 性别 女 女 女 女 女 男 男 财务管理 男 财务管理 男 财务管理 男 财务管理 男 财务管理 男 财务管理 女 财务管理 女 分析结果如下表所示 表1

表2

请对此结果进行分析和解释。(注:要求对每个表都要分别分析。)

答:表1是方差齐次性检验表,由于Sig.为0.856>0.05,因此认为各项的方差没有显著性差异。

表2是方差分析表。职业、性别和职业性别共同交互作用的Sig.都小于0.05,因此在0.05显著性水平下拒绝原假设,认为职业、性别及其交互作用效应都显著,即对月薪都有显著影响。

18.在一项关于城市租房的研究中,调查了11 个小区的情况,资料如下表所示

小区的租房情况资料 小区 编号 1 2 3 4 5 6 月平均家 庭收入/元 3400 3700 3900 4200 4100 4500 离市中心 的距离/km 7.5 6.3 5.0 3.6 4.5 4.8 有三居室的住 宅月租金/元 1500 1600 1800 2200 2000 2050 分析结果如下表所示

表 1

表 2

试对月平均家庭收入、离市中心的距离和有三居室月租金三个变量进行相关分析和偏相关分析。(注:要求对每个表都要分别分析。)

答:表1结果显示:变量X1、X2和Y的相关系数分别为0.911和-0.851,二者均在0.01的显著性水平下显著。这一点可以从两方面得知:其一是这两个数的右肩上的双星**,其二是由第二行双侧检验的显著性概率(Sig.)小于0.01再次得到印证。结果还表明在0.05的显著性水平下,变量X1和X2的相关系数为-0.642也显著,但二者的负相关表明月平均收入越高,则租住的房子距离市中心越近;而月平均家庭收入越低,则租住的房子距离市中心越远。

表2结果显示:在控制变量X2即离市中心的距离的情况下,变量X1即月平均家庭收入与变量Y即“有三居室的住宅月租金”的偏相关系数为0.905,因此,在0.01的显著性水平下高度显著。

19.一家大型制造业公司每年都要对其雇员进行积极性评估,并按50分制打分(1分代表无积极性……,50分代表最高积极性)。该公司想确定一名雇员每年失去的工时数与这名雇员的积极性得分之间是否存在某种关系,因此抽取了8名雇员组成的样本,数据如下表所示。

试计算Sperman等级相关系数,即对失去工时数与积极性得分之间关系强度的度量。

雇员序号 1 2 3 4 失去的工时(X) 积极性得分(Y) 49 36 127 91 39 42 10 25 雇员序号 5 6 7 8 失去的工时(X) 积极性得分(Y) 72 34 155 11 22 35 15 48 分析结果如下表所示

请对此结果进行分析和解释。

答:输出结果说明:相关系数为-0.881,说明失去工时数与积极性得分之间呈负相关,意味着:失去工时数越多,则积极性得分越少。并且相关系数大于0.8,说明二者之间的相关程度较高。

20.为了了解质量和价格对杂货店惠顾率的影响,调查了某城市中14 个主要的店铺,根据店铺偏好、产品质量和定价情况进行排序。所有的排序都是用11 级量表测量的,数据如表所示,数字越在越好。进行多元回归分析,解释产品质量和定价对店铺偏好的影响。

店铺编号 偏好 1 2 3 4 5 6 7 6 9 8 3 10 4 5 质量 5 6 6 2 6 3 4 价格 3 11 4 1 11 1 7 店铺编号 偏好 8 9 10 11 12 13 14 2 11 9 10 2 9 5 质量 1 9 5 8 1 8 3 价格 4 8 10 8 5 5 2 分析要点: (1) 用一次进入法建立回归方程,估计的回归方程是否很好地拟合了数

据;

(2) 对总体回归方程显著性的检验,显著性水平为0.01 (3) 在0.01的显著性水平下,每个回归系数是否显著 (4) 写出回归方程 结果分析:

表 1

这是进入/剔除变量表,此表表明:因变量是“偏好”;自变量是“价格”、“质量”,且要求二者全部进入回归方程。

表 2

这是模型概要:复相关系数R=0.975;拟合优度R2= 0.951,调整后的拟合优度为0.942。应该说都很高,接近于1,说明回归方程很好地拟合了数据。

表 3

这是方差分析表。从表中看出:F统计量值为105.826,相应的Sig.是F值的实际显著性概率值,Sig.<0.01,所以拒绝原假设,认为回归方程线性关系显著。

表 4

回归系数的显著性检验t检验,即要检验自变量对因变量的影响是否显著。(原假设系数为0)“质量”和“价格”的Sig.都小于0.01,所以拒绝原假设,认为自变量“质量”和“价格”的回归系数高度显著。

从回归系数表中可以得出其模型:y=0.976x1+0.251x2+0.535