方法:画散点图→Analyze→Correlate→Bivarite,打开Bivarite Correlations(二元相关变量分析)对话框,决定选项,单击“确定”
Bivariate对话框:上部用于选择希望进行相关分析的变量;中部的 Correlation Coefficients复选框组用于进一步选择不同的相关分析指标,有 Pearson相关系数、等级相关系数和秩相关系数三种可供选择,默认为前者;在其下方的 Test of Significance单选框组用于确定是进行相关系数的单侧(One-tailed)或双侧(Two-tailed)检验,默认为双侧检验;最下方的 Flag significant correlations复选框要求在结果中用星号标记有统计学意义的相关系数,默认选中。此时 P <0.05 的系数值旁会标记一个星号,P <0.01则标记两个星号。
Options子对话框主要用于选择需要计算的描述统计量(包括均数、标准差、离均差平方和以及协方差阵)和缺失值处理方法,可根据需要自行选择
例上海医科大学儿科医院研究某种代乳粉的营养价值是用大白鼠做试验,得大白鼠进食量(g)和体重增量(g)间的关系的原始数据如下,试分析两者有无直线相关关系。 动物编号 1 2 3 4 5 6 7 8 9 10 进食量(g)feed 820 780 720 867 690 787 934 679 639 820 体重增量(g)weight 165 158 130 180 134 167 186 145 120 15 利用散点图可以发现两变量间存在着明显的现线性趋势
依步骤操作,将feed、weight变量移入右侧变量框中,点击确定 可以看到变量 feed 和 weight的相关系数为 0.940,对相关系数的检验双侧的 P 值小于 0.01,所以可以认为 feed 和 weight两者有非常密切的关系
本例中,也可以选择其他2种相关系数,但计算效能不如Pearson相关系数 6.2简单回归分析
一、一元线性回归方程
简单回归分析:寻找因变量数值随自变量变化而变化的直线趋势,并在散点图上找到这样一条直线,相应的方程也就被称为直线回归方程。 直线回归方程:y=a+bx
a为回归直线的截距,b为回归直线的斜率,也称回归系数
通过回归方程解释两变量之间的关系会显的更为精确,例如可以计算出大白鼠每进食一个单位代乳粉体重平均增加的单位数量 通过回归方程还可以进行预测和控制,预测就是在回归方程中控制了变量 x的取值范围就可以相应的得到变量 y的上下限,而控制则正好相反,也就是通过限制结果变量 y的取值范围来得到x的上下限 二、方法
按Analyze→Regression→Linear Regression对话框
在左侧的源变量框中选择一个变量作为因变量,将其送入Depndent框中;选择一个或多个变量作为自变量,将其送入Independent(s)框中
单击Statistics按钮,打开Statistics对话框选择输出的统计量 例 上例得到了线性相关结论,因此直接进行回归分析,操作如下: Analyze→Regression→Linear Dependent框:weight Independent框:feed
结果中,第1个表是对模型中各个自变量纳入模型情况进行的汇总,可以看到进入模型的只有一个 feed变量,变量选择的方法为强行进入法,也就是将所有的自变量都放入模型中
17
第2个表是对模型的简单汇总,其实就是对回归方程拟和情况的描述,通过这张表可以知道相关系数的取值(R),相关系数的平方即决定系数(R Square),校正后的决定系数(Adjusted RSquare)和回归系数的标准误(Std. Errorofthe Estimate) 第3个表即为对模型进行方差分析的结果,可以看到方差分析的结果 F 值为 60.197,P 值小于 0.05,所以该模型是有意义的(在简单回归中方差分析的结果和 t检验的结果完全等价)
最后一张结果表格最重要,其中给出了回归方程中常数项、回归系数的估计值和检验结果,可见 a = - 17.357,b = 0.222,通过它就可以写出回归方程了,如下: 体重增量 = -17.357 +0.222 ×进食量
1、试以spss自带的某一个数据文件为例进行分析,了解变量是否相关,发掘数据中的规律,写入实验报告。
2、研究投资性变量与国民收入之间的相关关系。投资性变量选取5个变量:工业劳动者人数、农业劳动者数、货物周转量(铁路、公路、水路、民用航空、管道输油或气量)、生产性建设投资、建设安装工程投资;国民收入变量为:农业国民收入、工业国民收入、建筑业国民收入、运输业国民收入。现抽取从1963年~1982年共20年的统计数据(见下表),试选一对较合适的变量进行相关与回归分析,并解释统计结果。
表 1 统计数据 序号 工业劳动者人数X1 农业劳动者人数X2 货物周转量X3(亿吨生产性建设投资X4(亿元) 建设安装工程投资X5农业国民收入Y1 工业国民收入Y2 建筑业国民收入Y3(亿元) 运输业国民收入Y4(亿元) (万人) (万人) 公公里) (亿元) (亿元) (亿元) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 1632 1695 1828 1974 2032 2092 2365 2809 3233 3496 3704 3900 4284 4692 4809 5009 5340 5600 5796 5930 21968 22803 23398 24299 25167 26065 27119 27814 28400 28286 28861 29222 29460 29448 29345 29426 29425 30211 31174 32013 2348 2750 3463 3901 3050 3109 3753 4565 5205 5644 6294 6314 7297 6904 7969 9829 10907 11517 11616 12403 78.05 64.66 488.0 549.0 337.0 422.0 505.0 606.0 505.0 449.0 587.0 772.0 873.0 920.0 995.0 986.0 40.0 50.0 53.0 58.0 55.0 44.0 60.0 80.0 91.0 88.0 92.0 99.0 39.0 44.0 58.0 66.0 52.0 49.0 62.0 74.0 80.0 84.0 89.0 85.0 96.0 92.0 106.0 118.0 121.0 117.0 120.0 133.0 112.26 92.38 144.74 109.18 641.0 172.70 119.37 692.0 114.21 86.62 91.22 63.77 703.0 714.0 163.93 114.68 722.0 275.96 168.64 795.0 288.82 199.68 826.0 272.82 194.00 830.0 275.88 193.43 911.0 281.76 197.60 951.0 335.88 228.74 985.0 305.81 212.91 996.0 303.47 227.09 981.0 1113.0 113.0 1050.0 120.0 1195.0 124.0 396.24 300.85 1065.0 1408.0 125.0 365.14 343.80 1318.0 1536.0 130.0 359.23 381.07 1467.0 1688.0 169.0 252.43 317.32 1658.0 1709.0 175.0 302.90 397.35 1893.0 1792.0 194.0 3、完成实验报告
18