社会统计学期末复习题与答案整理 下载本文

(4)典型组讨论

典型组讨论是由8~12个具有某些共同特征或经历的人,在一个经过专门培训主持人的引导下、围绕着某一专门话题进行互动小组讨论的一种定性调查方式。目前有地方使用的电话典型组、网络典型组、视频典型组都是典型组讨论的方式之一。

9.数据分析中的归纳法和演绎法分别是什么? P19

数据分析法

(1)归纳法与演绎法

归纳法与演绎法是社会研究的两种基本推理方式。归纳法是从特殊到一般,也就是从一组具体的观察结果推导出一般性的规律或法则;演绎法则与归纳法正好相反,是从一般到特殊,也就是研究者从想要检验的一般性理论开始,然后去观察、收集资料,通过这些资料来检验这个理论。

10.SPSS主要有哪些功能? P25统计分析功能和数据管理功能。 11.在SPSS中如何定义变量属性? P30

变量属性 SPSS中变量有三种基本类型:数值型、字符型、日期型。 (1)数值型变量

数值型变量是SPSS中最常用的变量类型。数值型变量包括标准数值型、逗号数值型、圆点数值型、科学计数法型、美元数值型、自定义型。 (2)字符型变量

字符型变量也是SPSS中比较常用的数据类型,默认长度为8。例如姓名、地点等都可以定义为字符型变量,字符型变量不能参与运算。 (3)日期型变量

日期型变量可以用来表示日期,也可以表示时间,例如调查时间、出生日期等都可以定义为日期型变量。

12.等距分组和不等距分组有什么区别?请举例说明。 P46

在分组时,如果分组组距相等,就是等距分组,如:学生平均每天上网时间:组距设3,分成3-6,6-9,9-12,12-15共4个小组。如果分组组距不相等,就是不等距分组。如:人口分析,分婴幼儿组(0-6),少儿组(7-17),中青年组(18-59),老人组(60-130),组距不相等。

13.统计表主要由哪几部分构成?

13

答:统计表主要有标题、标目、线条、数字四部分构成,有些统计表还有备注。

14.条形图和直方图有什么区别? P63

(1)条形图:用宽度相同的条形的高度或者长短来表示数据多少的图形。条形图既可以横置也可以纵置,纵置时也可以称为柱形图。 条形图的绘制

在绘制条形图时,如果将类别放在纵轴,即条形图横置,称为条形图;如果将类别放在横轴,即纵置,称为柱形图。绘制条形图是既可以绘制成二维平面图,也可以绘制成三维立体图。 直方图的定义

直方图:就是用矩形的宽度和高度来表示频数分布的图形。

在平面直角坐标系中,我们用横轴表示数据分组,用纵轴表示频数或频率,各个组的频数与频率形成一个小矩形,就是直方图。

15. 简述众数、中位数和平均数作为测量中心趋势的指标所适用的数据类型。P82,P83

众数只与变量值出现的次数有关,适用于定序数据、定类数据和数值型数据中心趋势的测量。但主要适用于定类数据中心趋势的测量,

中位数只与变量值的排序有关,因而它适用于定序数据和数值型数据中心趋势的测量。但主要适用于定序数据中心趋势的测量,

平均数是将所有数据加总后除以数据总个数得出的。主要适用于数值型数据中心趋势的测量。

数值型数据也可以用众数和中位数测量中心趋势,但均值最佳。

16. 简述定类变量、定序变量和数值型变量集中趋势测量的方法。与第二题一样 P83的表格

定类数据 定序数据 数值型数据 数据类型 适用的测量值 众数

中位数 分位数 均值 中位数 14

相关系数

众数 分位数 众数 17.简述相关系数的取值与意义。 P174

相关系数就是对变量之间相关关系程度和方向的度量。当研究两个变量之间的相关关系时我们称之为简单相关系数。总体相关系数用ρ表示,样本相关系数一般用r表示。1、符号:如果为正号,则表示正相关,如果为负号,则表示负相关。

通俗点说,正相关就是变量会与参照数同方向变动,负相关就是变量与参照数反向变动; 2、取值为0,这是极端,表示不相关;3、取值为1,表示完全正相关,而且呈同向变动的幅度是一样的;4、如果为-1,表示完全负相关,以同样的幅度反向变动;5、取值范围:[-1,1].相关系数的绝对值越大,相关程度越强,相关系数的绝对值越小,相关程度越

弱。

18. 什么是回归分析?其作用是什么? P177 4、回归分析

回归分析是通过一定的数学表达式将变量间的关系进行描述,确定一个变量或几个变量的变化对另一个特定变量的影响,是进行估计或预测的一种方法,侧重于考察变量之间的数量伴随关系。

回归分析的作用是①从一组数据出发确定某些变量之间的定量关系式,

②对变量间这些关系式进行统计检验。并从影响某一个变量的多个变量中找出影响显著的变量③利用所求出的关系式,根据一个变量或多个变量取值估计或预测另一个特定变量的取值。

19. 什么是简单一元线性回归分析?其作用是什么? P178

一元线性回归就是对具有线性相关关系的两个变量之间(其中一个为自变量)数量变化的一般关系进行预测,确定相应的数学关系式,以便进行估计或预测。通常将描述因变量y如何依赖自变量x和误差项e的方程称为回归模型。一元线性回归模型表达式为:

y??0??1x??

20. 一元线性回归模型中有哪些基本假定 P179 一元回归模型的三个基本假定

(1)误差项?是一个期望值为0的随机变量,即E(?)=0。在一个回归模型

15

?0和?1都是常数,中,因而,对于一个特定的x值,y的期望值为E(y)= ?0??1x。

(2)对于所有的x值,?的方差?都是相同的。

2(3)误差项?是一个服从正态分布的随机变量,而且互相独立,即?~N(0,1)。

21.如何对配对样本进行t检验。 P203 (1)配对样本T检验方法

配对样本检验主要是判断不同的处理或试验结果是否有差异。配对样本T检验(Paired—Sample T test)用于检验两个相关的样本(配对样本)是否来自具有相同均值的总体,因此针对配对样本我们可以首先计算出两个样本每个对应变量间的差值,然后再检验其差值的均值是否为零,若均值接近于零(即在给定的置信区间内),说明两个样本均值在给定的置信水平上没有差异;若均值在给定置信区间以外,说明两个样本均值在给定的置信水平上有差异。 (2)利用SPSS进行配对样本T检验

在SPSS主菜单选中Analyze—>Compare Means—>Paired—Sample T Test,出现图11—4所示窗口。“Paired Variables”框中的变量作为分析变量,总是成对出现,指定要检验的两个变量到“Paired Variables”输入栏里的“Variable1”和“Variable2”中,在“Current Selections”栏中就会显示被选中的成对变量,在“Options”选项中可以进行置信水平和缺失值的设置,同单样本T检验。

22.简要举例说明在分析双变量的关系时,t检验和卡方检验的主要区别。 P207

T检验(T Test)是最常见的一种假设检验类型,主要验证总体均值间是否存在显著性差异。T检验属于参数假设检验,所以它适用的范围是数值型的数据,在网站分析中可以是访问数、独立访客数、停留时间等,电子商务的订单数、销售额等。T检验还需要符合一个条件——总体符合正态分布。

卡方检验(chi-square test),也就是χ2检验,用来验证两个总体间某个比率之间是否存在显著性差异。卡方检验属于非参数假设检验,适用于布尔型或二项分布数据,基于两个概率间的比较,早期用于生产企业的产品合格率等,在网站分析中可以用于转化率、Bounce Rate等所有比率度量的比较分析,

23. 简要说明卡方的拟合优度检验和独立性检验的含义。 P178 2、拟合优度检验

(1)拟合优度检验

从总体的不同类别中抽取元素构成样本,样本包含总体中各个类别的元素,对不同类别的目标量之间是否存在显著性差异进行的检验称为拟合优度检验。拟合优度检验是?检验中重要的一部分,可以同时对多个总体进行比较。在?检验中,如果?22222统计量小于给定的??,那么就不能拒绝原假设,如果大于则拒绝。即?检验的拒绝2域是?>??(k-1),其中k-1是自由度。自由度是可以自由变动的变量个数,在列

2 16