统计学第四版贾俊平人大_回归与时间序列stata 下载本文

.word格式,

SUMMARY OUTPUT

回归统计

Multiple R 0.79508

R Square 0.632151

Adjusted R

0.611715

Square 标准误差 2.685819

观测值 20

方差分析

回归分析

残差 总计

Intercept X Variable 1

Significance

df SS MS F

F

1 223.1403 223.1403 30.93318 2.79889E-05 18 129.8452 7.213622

19 352.9855

Coefficients 标准误差 t Stat P-value Lower 95%

49.31768 3.805016 12.96123 1.45E-10

0.249223 0.04481 5.561761 2.8E-05 Excel输出的回归结果包括以下几个部分: 第一部分是“回归统计”,这部分给出了回归分析中的一些常用统计量,

包括表中复相关系数Multiple R=0.79508,它是度量复相关程度的指标,取值[0,1]之间,取值越大,表明要素或变量之间的线性相关程度越密切; 判定系数R Square=0.632151,表示有63.2151%的出租率可以由每平方米月租金之间的线性关系来解释;

调整的决定系数Adjusted R Square=0.611715,表示调整后的判定系数使用了自由度为一个权重因子,即使解释变量增加,如果它与被解释变量无关,则调整后的判定系数不会增加会减少;

标准误差,表示各测量值误差的平方的平均值的平方根,故又称为均方误差的平方根,在这里取2.685819(已验证,该值即为 ); 观测值个数19。

第二部分是“方差分析”,这部分给出的是回归分析的方差分析表,包括自由度df、回归平方和SSR=223.1403、残差平方和SSE=129.8452、总平方和SST=352.9855、回归的均方根223.1403、残差的均方根MSE=7.213622;

检验统计量

Upper 下限 上限

95% 95.0% 95.0%

41.32363505 57.31172 41.323635 57.31172 0.155080305 0.343365 0.1550803 0.343365

;F检验的显著性水平Significance F=2.79889E-05,用于线性关

系的显著性检验,说明两个变量之间的线性是否显著;

第三部分是参数估计的有关内容。包括 回归方程的截距β0=49.31768;

斜率β1=0.249223,表示月租金变化1元引起的出租率变化24.9223%; 截距的标准误差3.805016,斜率的标准误差0.04481;

, 专业.专注 .

.word格式,

用于回归系数检验的t统计量及对应的P值,说明回归系数的显著性,即月租金和出租率两者之间是否有显著关系;

截距和斜率的置信区间[Lower 95%, Upper 95%]。

11.9 (1)方差分析表

方差分析

df

SS

MS

F

Significance

F

回归分

1 1602708.6 1602708.6 399.1 2.17E-09

析 残差 10 40158.07 4015.807

总计 11 1642866.67

(2) ,即汽车销售量的变差中有97.556%由广告费用的变动引起。

(3)汽车销售量与广告费用的相关系数 ,表明汽车销售量与广告费用有高度的相关性。 (4)由题意得,y=1.420211x+363.6891。β0=363.6891,表示回归直线的截距为363.6891;β1=1.420211,表示广告费用提高1单位使汽车销售量改变1.420211单位。

(5)线性关系显著性检验的 ,其对应的P= Significance F= 0.00000000217<0.05,。 故拒绝原假设,即汽车销售量与广告费用之间的线性关系显著。

11.10 (1)编辑数据集,命名为linehuigui7.dat

输入命令scatter y x,得到如下散点图,可以看到,y和x是负线性相关的关系。

(2)输入命令reg y x得到下图:

, 专业.专注 .

.word格式,

可得线性函数:y=2.302932x+13.62541,即β0=13.62541,表示回归直线的截距为13.62541;β1=2.302932,表示x变化1单位使使y变化2.302932单位。 (3)输入predict yhat gen e=x-yhat

得到残差e,见下图:

由(2)的结果可得,判定系数 , 即y的变差93.73%由x引起,y和x之间有较强的线性关系;

估计标准误差 ;

由于 ,y和x之间有较强的线性关系,直线拟合得较好。

11.11 (1)

(2) ;

(3)由 ,故拒绝原假设;

(4) ;

(5)由(3)知,x与y之间有显著的线性关系。

11.12 由题意得,12取y0为x0=4的预测值,x1为x平均值, x2=(x0-x1)^2,x3= sum((x-x1)^2)

, ,

y0=3*4+5=17,

x1=2, x2=4, x3= 20

display 17+2.1009*1.0*sqrt(1/20+4/20),得zu= 18.05045 display 17-2.1009*1.0*sqrt(1/20+4/20),得zl= 15.94955 display 17+2.1009*1.0*sqrt(1+1/20+4/20),得yu= 19.348878 display 17-2.1009*1.0*sqrt(1+1/20+4/20),得yl= 14.651122

即x为4元时,y的95%的置信区间为[15.94955, 18.05045],预测区间为[14.651122, 19.348878]。

11.13 (1)编辑数据集,命名为linehuigui8.dat

, 专业.专注 .

.word格式,

输入命令scatter y x,得到如下散点图,可以看到,y和x是负线性相关的关系。

(2)输入命令reg y x得到下图:

可得线性函数:y=15.23977x-46.29181,即β0=-46.29181,表示回归直线的截距为-46.29181;β1=15.23977,表示x变化1单位使使y变化15.23977单位。 (3)输入如下命令,得到置信区间示意图: predict yhat

predict stdp, stdp

generate zl = yhat - invttail(20,0.025)*stdp generate zu= yhat + invttail(20,0.025)*stdp

twoway (lfitci y x, level(95)) (scatter y x) (line zl zu x, pstyle(p2 p2 p3 p3) sort)

取y0为x0=40的预测值,x1为x平均值,x2=(x0-x1)^2,x3= sum((x-x1)^2)

, 专业.专注 .