.word格式,
SUMMARY OUTPUT
回归统计
Multiple R 0.79508
R Square 0.632151
Adjusted R
0.611715
Square 标准误差 2.685819
观测值 20
方差分析
回归分析
残差 总计
Intercept X Variable 1
Significance
df SS MS F
F
1 223.1403 223.1403 30.93318 2.79889E-05 18 129.8452 7.213622
19 352.9855
Coefficients 标准误差 t Stat P-value Lower 95%
49.31768 3.805016 12.96123 1.45E-10
0.249223 0.04481 5.561761 2.8E-05 Excel输出的回归结果包括以下几个部分: 第一部分是“回归统计”,这部分给出了回归分析中的一些常用统计量,
包括表中复相关系数Multiple R=0.79508,它是度量复相关程度的指标,取值[0,1]之间,取值越大,表明要素或变量之间的线性相关程度越密切; 判定系数R Square=0.632151,表示有63.2151%的出租率可以由每平方米月租金之间的线性关系来解释;
调整的决定系数Adjusted R Square=0.611715,表示调整后的判定系数使用了自由度为一个权重因子,即使解释变量增加,如果它与被解释变量无关,则调整后的判定系数不会增加会减少;
标准误差,表示各测量值误差的平方的平均值的平方根,故又称为均方误差的平方根,在这里取2.685819(已验证,该值即为 ); 观测值个数19。
第二部分是“方差分析”,这部分给出的是回归分析的方差分析表,包括自由度df、回归平方和SSR=223.1403、残差平方和SSE=129.8452、总平方和SST=352.9855、回归的均方根223.1403、残差的均方根MSE=7.213622;
检验统计量
Upper 下限 上限
95% 95.0% 95.0%
41.32363505 57.31172 41.323635 57.31172 0.155080305 0.343365 0.1550803 0.343365
;F检验的显著性水平Significance F=2.79889E-05,用于线性关
系的显著性检验,说明两个变量之间的线性是否显著;
第三部分是参数估计的有关内容。包括 回归方程的截距β0=49.31768;
斜率β1=0.249223,表示月租金变化1元引起的出租率变化24.9223%; 截距的标准误差3.805016,斜率的标准误差0.04481;
, 专业.专注 .
.word格式,
用于回归系数检验的t统计量及对应的P值,说明回归系数的显著性,即月租金和出租率两者之间是否有显著关系;
截距和斜率的置信区间[Lower 95%, Upper 95%]。
11.9 (1)方差分析表
方差分析
df
SS
MS
F
Significance
F
回归分
1 1602708.6 1602708.6 399.1 2.17E-09
析 残差 10 40158.07 4015.807
总计 11 1642866.67
(2) ,即汽车销售量的变差中有97.556%由广告费用的变动引起。
(3)汽车销售量与广告费用的相关系数 ,表明汽车销售量与广告费用有高度的相关性。 (4)由题意得,y=1.420211x+363.6891。β0=363.6891,表示回归直线的截距为363.6891;β1=1.420211,表示广告费用提高1单位使汽车销售量改变1.420211单位。
(5)线性关系显著性检验的 ,其对应的P= Significance F= 0.00000000217<0.05,。 故拒绝原假设,即汽车销售量与广告费用之间的线性关系显著。
11.10 (1)编辑数据集,命名为linehuigui7.dat
输入命令scatter y x,得到如下散点图,可以看到,y和x是负线性相关的关系。
(2)输入命令reg y x得到下图:
, 专业.专注 .
.word格式,
可得线性函数:y=2.302932x+13.62541,即β0=13.62541,表示回归直线的截距为13.62541;β1=2.302932,表示x变化1单位使使y变化2.302932单位。 (3)输入predict yhat gen e=x-yhat
得到残差e,见下图:
由(2)的结果可得,判定系数 , 即y的变差93.73%由x引起,y和x之间有较强的线性关系;
估计标准误差 ;
由于 ,y和x之间有较强的线性关系,直线拟合得较好。
11.11 (1)
;
(2) ;
(3)由 ,故拒绝原假设;
(4) ;
(5)由(3)知,x与y之间有显著的线性关系。
11.12 由题意得,12取y0为x0=4的预测值,x1为x平均值, x2=(x0-x1)^2,x3= sum((x-x1)^2)
, ,
y0=3*4+5=17,
x1=2, x2=4, x3= 20
display 17+2.1009*1.0*sqrt(1/20+4/20),得zu= 18.05045 display 17-2.1009*1.0*sqrt(1/20+4/20),得zl= 15.94955 display 17+2.1009*1.0*sqrt(1+1/20+4/20),得yu= 19.348878 display 17-2.1009*1.0*sqrt(1+1/20+4/20),得yl= 14.651122
即x为4元时,y的95%的置信区间为[15.94955, 18.05045],预测区间为[14.651122, 19.348878]。
11.13 (1)编辑数据集,命名为linehuigui8.dat
, 专业.专注 .
.word格式,
输入命令scatter y x,得到如下散点图,可以看到,y和x是负线性相关的关系。
(2)输入命令reg y x得到下图:
可得线性函数:y=15.23977x-46.29181,即β0=-46.29181,表示回归直线的截距为-46.29181;β1=15.23977,表示x变化1单位使使y变化15.23977单位。 (3)输入如下命令,得到置信区间示意图: predict yhat
predict stdp, stdp
generate zl = yhat - invttail(20,0.025)*stdp generate zu= yhat + invttail(20,0.025)*stdp
twoway (lfitci y x, level(95)) (scatter y x) (line zl zu x, pstyle(p2 p2 p3 p3) sort)
取y0为x0=40的预测值,x1为x平均值,x2=(x0-x1)^2,x3= sum((x-x1)^2)
, 专业.专注 .