16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
女 男 女 男 男 女 男 男 男 男 男 女 女 女 男 1 4 3 2 2 2 2 3 3 4 4 2 3 1 3 3 10 9 6 2 3 10 20 16 25 10 5 15 1 6 26 36 34 28 28 28 30 50 45 48 34 29 38 25 35 1600 4000 3150 1800 1800 1850 1900 3400 3300 4800 4500 2000 3200 1500 3100 2、试录入以下数据文件,保存为“数据2.sav”。 序号 性别 职称 在公司工作的时间 31 32 33 34 35 36 37 38 39 40
3、试将数据2合并到数据1,合并后的数据文件另存为“数据3.sav”。
4、将工资进行重编码,2000以下(含2000) 为1,2000-3000为2,3000-4000为 3,4000以上为4,重编码的结果保存为“工资等级”。新数据文件保存为“数据4.sav”。
5、求出各职工刚进入公司时的年龄,保存为“初入年龄”。新数据文件保存为“数据5.sav”。
6、试按各职员的工资数进行排秩,排秩要求工资最高的排为第一,相同数额取平均等级。排秩后的数据文件保存为“数据6.sav”。
7、试按各职员的工资数分性别进行排序,要求先排男性,后排女性。同一性别按工资从高到低排列。排序后的数据文件保存为“数据7.sav”。
8、试寻找一个新数据文件,将其中一些新变量合并到数据文件7中,合并后的新数据文件保存为“数据8.sav”。 9、完成实验报告
男 男 男 女 女 女 男 男 男 男 3 4 4 2 1 4 3 3 4 3 16 30 10 5 5 18 5 15 18 6 年龄 46 51 33 29 33 48 37 38 48 35 工资 3300 5000 4500 2000 1500 4700 3050 3200 4700 3100
13
第4章 统计图形
4.1 常用统计图种类 一、单变量图
一般用于考察某个变量的分布类型 1.连续变量
直方图:横轴表示取值区段,纵轴表示频数,直观描 述数量变化规律
箱图:使用百分位数指标,如中位数、四分位数描述 数量变化规律 2.分类变量
简单条形图:展示变量各类别频数,与直方图类似 饼图[或Pareto图]:表示各类别占总体的构成比例 二、双变量图
一般用于分析两个变量间的数量联系 1.连续因变量 线图、散点图 2.分类因变量 条形图
4.2 统计图的操作 一、常规图形输出
方法:打开指定文件→图表→选择相应图形命令(选 项)→按要求设置→按“确定” 二、交互式绘图
交互式绘图:利用Interactive Graph的对话框进行 基本特点:
选择变量时,提供了提供了拖放功能 变量类型不同,表示符号不同 采用选项卡形式,层次清楚 绘图交互灵活,功能强大
方法:打开指定文件→图表→交互图表→选择相应图 形命令(选项)→按要求设置→按“确定”
1、试以spss自带的某一个数据文件为例进行分析,了解数据分布的基本特征,完成条形图、圆图、直方图、散点图等的生成与编辑方法,写入实验报告。
2、为研究工人矽肺患病率与工龄的关系,某市疾病控制中心收集了以下资料。
题 2表
工龄 <5年 5年- 10年- 合计
14
甲矿 检查人数 5406 2537 2169 10112 矽肺人数 39 77 265 381 患病率 0.0072 0.0304 0.1222 0.0377 检查人数 1856 2734 3185 7775 乙矿 矽肺人数 11 84 347 442 患病率 0.0059 0.0307 0.1089 0.0568 对于题 2表所示资料,请选用1或2种统计图进行统计描述。
3、某研究者调查了甲、乙两地各240例被访者对互联网的使用情况,资料如题 3表所示,请绘制饼图。
题 3表 地区 甲地 乙地 合计
每天上网 经常上网 偶尔上网 从不上网 合计 49(19.84% ) 92(37.25% ) 65(26.32% ) 41(16.60% ) 247(100.00% ) 62(21.83% ) 113(39.79% ) 67(23.59% ) 42(14.79% ) 284(100.00% ) 111(20.90% ) 205(38.61% ) 132(24.86% ) 83(15.63% ) 531(100.00% ) 4、完成实验报告
第5章 基本统计分析
5.1频数分析
利用频数分析可以方便地对数据按组进行归类整理,形成各变量的不同水平(分组)的频数分布表和图形,以便对各变量的数据的特征和记录分布状况有一个概括的认识 方法:按“分析”→“描述统计”→“频数分布表”,打开频数分析对话框 在左侧的源变量框中选择一个或多个变量,单击向右箭头按钮使其进入右侧的变量框中;选中“显示频数分布表”复选项,将显示频数分布表;单击“统计”、“图表”、“格式”打开各对话框,在对话框中确定需要的输出结果及格式
例 有27个工人看管机器台数如下:
5 4 2 4 3 4 3 4 4 2 4 3 4 3 2 6 4 4 2 2 3 4 5 3 2 4 3 试分析这27人看管机器台数的分布情况
5.2描述性统计分析
描述统计分析通过计算平均值、算术和、标准差、最大值、最小值、方差、极值和均值标准误差等统计量对变量进行描述,并对数据标准化 方法:按“分析”→“描述统计”→“描述统计分析”,打开“描述统计分析”对话框 在左侧的源变量中选择一个或多个变量作为待分析变量移入变量框中;选中“将标准化数值保存为变量”复选项,对所选择的每一个变量进行标准化产生相应的Z变量,作为新变量保存在数据窗中,其变量名为相应变量名加前缀Z。
单击“选项”按钮,展开选项对话框,在对话框中可以指定其他统计量与输出结果显示的顺序
单击OK按钮
数据探索方法:读取一个数据文件→按“分析”→“描述统计”→“探索分析”,打开探索对话框
从左侧的源变量中,选择一个或多个数值型变量作为因变量进入“因变量列表”框中;指定分组变量;在“显示”栏中选择输出项,根据需要分别点击“统计”、“绘图”、“选项”;点击“确定”
1、以实验三中保存的“数据8.sav”或其他数据文件为例,熟悉report下面的4个分析命令。
⑴在线分析
15
⑵摘要分析 ⑶行形式分析 ⑷列形式分析
2、以实验三中保存的“数据8.sav”为例,要求用基本统计分析完成以下任务: ⑴求出性别、工资等级的频次分布表,性别的众数、工资等级的中位数,并用工资等级做条形图。
⑵求工资的均值、最大值、最小值、标准差、四分位数、十分位数,并用工资做带正态曲线的直方图。
⑶分性别求工资的标准分。
⑷求工资的峰度、偏度,对照带正态曲线的直方图理解结果。 ⑸对工资进行探索性分析。 3、完成实验报告
第6章 相关分析与回归分析
6.1 相关分析
相关分析是研究变量间密切程度的一种常用统计方法 一、变量间相关类型
直线相关:两变量呈线性相关
曲线相关:两变量存在相关趋势,但并非线性,而 是呈各种可能的曲线趋势
正相关与负相关:如A变量增加时B变量也增加,则 称为正相关反之,则为负相关
完全相关:得知A变量的取值就可以准确推算出B变 量的取值
当数据为有序变量或者名义变量时,一般不再考虑直 线、曲线相关的问题,但正、负相关和完全相关这些 概念则仍然适用
二、SPSS相关分析功能 Bivariate命令:用于进行两个或多个变量间的参数或非参数相关分析,如果是多个变量,则给出两两相关的分析结果;这是 Correlations子菜单中最为常用的一个过程 Partial Correlations 命令:若两个变量其取值均受到其他变量的影响,就可以利用偏相关分析对其他变量进行控制,输出控制其他变量影响后的相关系数
Distance命令:对变量或记录进行相似性或不相似测度,用于因子分析、聚类分析和多维尺度分析的预分析 三、简单相关分析
当两个连续变量在散点图上的散点呈现直线趋势时,就可以认为二者存在直线相关趋势,也称为简单相关趋势。Pearson相关系数是人们定量地描述线性相关程度好坏的一个常用指标 相关系数(r):描述变量间线性关系的程度和方向的统计量 相关系数具有如下特点:(1)相关系数 r是一个无单位的量值,且 -1 < r<1;(2)r>0 为正相关,r<0 为负相关。(3)|r|越接近于 1,说明相关性越好,|r|越接近于 0,说明相关性越差
16