图中可以看出log(x4)和log(x1)存在高度相关性,但并没有超过R^2,不是有害的。
3.运用逐步回归法克服多重共线性:
用每个x对y进行简单回归,按R^2排序: ① Log(y)=8.902+0.224log(x1) T=0.000 0.000 R^2=0.1101 DW=0.939 ② Log(y)=15.1574-0.3834log(x2) T=0.0174 0.4595 R^2=0.02 DW=0.33 ③ Log(y)=9.619+0.108log(x3) T=0.0000 0.2177 R^2=0.0652 DW=0.597 ④ Log(y)=8.9490+0.16697log(x4)
T=0.000 0.0000 R^2=0.602 DW=0.62
⑤ Log(y)=5.6007+0488731log(x5) T=0.0319 0.0485
R^2=0.158 DW=0.32
排序后:R1^2=77% R4^2=60.2% R5^2=15.8% R3^2=6.5% R2^2=2.4%
由此可见,粮食生产受农业化肥施用量的影响最大,与经验相符合,选
Log(y)=8.092+0.224log(x1)为初始回归模型,依次引入Log(x4) log(x5) log(x3) log(x2)进行回归,寻找最佳回归方程(见下表)(Y=log(y))
表2 逐步回归结果
Y=f(x1)t值probY=f(x1,x4)t值probY=f(X1,x5)t值probY=f(X1,X3)t值probY=f(X1,X2)t值prob如表中所示:
c8.902(0.00)9.18(0.00)8.72(0.00)9.42(0.00)-6.29(0.0022)log(x1)log(x2)log(x3)log(x4)log(x5)R^20.2240.770175(0.00)0.4702-0.2150.8402(0.00)(0.0052)0.220.0180.77(0.00)(0.8963)0.24-0.070.79(0.00)(0.1159)0.29781.250.94(0.00)(0.00)AICSC-3.255-3.1576-3.538-3.17-3.29-4.6-3.39-3.02-3.14-4.46 Log(x4)因为经济含义不符合,剔除 Log(x5)未通过显著性检验,剔除
Log(x3)未通过显著性检验,剔除
Log(x2)通过显著性检验,经济意义符合,R^2=0.94,均优于前面的,AIC,SC都有所降低,故保留。
Log(y)=-6.2856+0.2978log(x1)+1.2586log(x2) R^2=0.9452 F+statistic=189.9002 DW=1.59
由上表可以看出,该方程为最优模型:各解释变量均通过显著性检验, R^2 较优,F检验通过, 变量的系数均符合经济含义,已剔除多重共线性。
4.受线性约束回归的F检验 Wald检验:
通过此方法进一步验证是否应剔除解释变量log(x3) Log(x4)和log(x5):
可以看出,F检验和Wald检验的伴生概率都<0.05,说明原假设不成立,约束条件b3=b4=b5=0不成立,进一步检验b3=0是否成立。
可以看出,F检验和Wald检验的伴生概率都<0.05,说明原假设不成立,约束条件b3=0不成立,不应剔除解释变量log(x3),在此基础上检验是否应剔除log(x4)和log(x5).
可以看出,F检验和Wald检验的伴生概率都>0.05,说明原假设成立,约束条件成立,b4=b5=0,可以剔除log(x4)和log(x5).
结合以上分析,在之前得出的模型中加入解释变量Log(X3),建立多元回归模型:
由模型可知,所有解释变量均通过显著性检验,系数符号符合经济含义,R^2=0.978616,高于前面得出的模型,所以该模型为最优模型。由下图可知,真实值和估计值拟合的很好。 最优模型为:
logy=-5.999638+0.323385log(x1)+1.290729log(X2)-0.086754log(x3)