计量经济学报告
HC = 0.3682432196*GDP + 3637.165057
(54.44613)
(4.449148)
R2=0.989981 SER=3473.880 F-statistic=2964.381
经济变量解释:上式表明收入增加1元,居民消费增加0.368元。且其系数在1%的水平下是显著的。
1、内部有效性研究
(1 )遗漏变量偏差
下面居民消费水平与居民消费价格指数,税收,国内生产总值的关系。
Dependent Variable: HC
Method: Least Squares Date: 11/20/11 Time: 13:57 Sample: 1 32
Included observations: 32 Variable GDP CPI T C R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
Coefficient 0.504491 11.59546 -0.785146 -105.7312 Std. Error 0.061823 8.525088 0.257028 1129.732 t-Statistic 8.160305 1.360157 -3.054706 -0.093590 Prob. 0.0000 0.1846 0.0049 0.9261 34141.89 17.04108 17.22429 9174.554 0.000000
0.998984 Mean dependent var 33016.95 0.998875 S.D. dependent var 1145.235 Akaike info criterion 36723756 Schwarz criterion -268.6572 F-statistic 0.703801 Prob(F-statistic)
HC = 0.5044914707*GDP + 11.59545705*CPI - 0.7851461786*T - 105.7312267 R2=0.998984 F-statistic=9174.554
从上表中我们可以发现gdp, T的t统计量的绝对值都大于2.58,所以在5%的显著性水平下我们不能拒绝系数为0的原假设。所以认为gdp和T都是显著性的统计量。而对于cpi来说t-Statistic=1.360157,不能拒绝原假设,所以我们认为cpi是不显著的统计量,回归中应该将其去掉。
下面我们只针对gdp和T对居民消费做回归如下:
8
计量经济学报告
Dependent Variable: HC Method: Least Squares Date: 11/20/11 Time: 14:02 Sample: 1 32
Included observations: 32
Variable GDP T C R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
Coefficient 0.586370 -1.120968 1373.560 Std. Error 0.014285 0.072483 310.1370 t-Statistic 41.04908 -15.46522 4.428881 Prob. 0.0000 0.0000 0.0001 34141.89 17.04256 17.17997 13369.04 0.000000
0.998917 Mean dependent var 33016.95 0.998842 S.D. dependent var 1161.898 Akaike info criterion 39150182 Schwarz criterion -269.6809 F-statistic 0.920426 Prob(F-statistic)
HC = 0.5863701747*GDP - 1.120968306*T + 1373.560019
通过上表我们发现gdp和T的系数都通过了检验,我们认为gdp和T都是显著的统计量,即税收也影响居民消费水平。
经济变量解释:上式表明在其他条件不变的情况下,gdp每增加1元,居民消费水平增加0.586元。在其他条件不变的情况下,税收每增加的1元,居民消费水平平均减少1.12元。
如果存在遗漏变量偏差,需要满足两个条件:1 遗漏变量和x有相关性 2 遗漏变量需是y的影响变量。下面我们来检验以下T和gdp的相关性。
GDP T
GDP T
1.000000 0.987381 0.987381 1.000000
从上表中我们发现,T和gdp之间存在着高度的相关性。如果加上T的话可能就会存在多重共线性。如果存在多重共线性,则回归方程是错误的。所以方程中不应该加入T的变量。
也许还存在其他变量影响居民消费水平,如消费者偏好、消费者预期、消费信贷等等,但是这些变量是不可以量化的。我们无法得知具体的数据。但是目前为止我们认为回归的R=0.989981已经模拟的非常好了,同时又考虑到论文主要研究研究消费与收入的关系,在此重点对人均居民消费和人均国内生产总值进行回归。
2
9
计量经济学报告
(2) 变量有测量误差
鉴于我们的数据是从国家统计局数据库中找到的,我们认为数据来源的质量比较好,测量误差应该比较小,及时有测量误差,也不是我们能够控制的。所以我们假定数据没有测量误差。或者测量误差很小,基本上不存在内部无效的情况。
(3) 样本的选择
鉴于我们的数据是从国家统计局数据库中找到的,我们认为数据来源的质量比较好,所以我们认为在样本选择方面是比较好的。
(4) 函数形式
下面我们考虑下面几种不同的函数形式: Ln(hc)=β0+β1ln(gdp) Ln(hc)=β0+β1gdp+β2gdp2 首先我们来观察下各自回归的方程
Dependent Variable: LOG(HC) Method: Least Squares Date: 11/20/11 Time: 14:26 Sample: 1 32
Included observations: 32 Variable LOG(GDP)
C R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat Coefficient 0.927822 -0.006741 Std. Error 0.007021 0.074169 t-Statistic 132.1489 -0.090887 Prob. 0.0000 0.9282 1.338669 -2.853897 -2.762288 17463.33 0.000000 0.998285 Mean dependent var 9.705748 0.998228 S.D. dependent var 0.056353 Akaike info criterion 0.095270 Schwarz criterion 47.66234 F-statistic 0.190392 Prob(F-statistic)
LOG(HC) = 0.9278224632*LOG(GDP) - 0.006740935085 R-squared=0.998285 Adjusted R-squared=0.998228
经济关系解释:该回归提高了R2,和调整的R2,但是变化不是很大,同时系数在1% 水
10
计量经济学报告
平下是显著的。该式表明gdp每增加1%,居民消费增加0.927%。
Dependent Variable: HC Method: Least Squares Date: 11/20/11 Time: 14:25 Sample: 1 32
Included observations: 32
Variable GDP GDP^2 C R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
Coefficient 0.470745 -3.59E-07 710.8594 Std. Error 0.007175 2.38E-08 340.1363 t-Statistic 65.60950 -15.09100 2.089925 Prob. 0.0000 0.0000 0.0455 34141.89 17.08613 17.22355 12798.37 0.000000
0.998868 Mean dependent var 33016.95 0.998790 S.D. dependent var 1187.491 Akaike info criterion 40893900 Schwarz criterion -270.3781 F-statistic 0.490688 Prob(F-statistic)
HC = 0.4707451193*GDP - 3.594682139e-07*(GDP^2) + 710.8593578
R-squared=0.998868 Adjusted R-squared=0.998790
经济关系解释:相对于线性函数来说,该回归提高R2和调整的R2。该式表明gdp每增加1元,居民消费水平增加0.47元。我们发现虽然gdp2的系数虽然在1%的水平下是显著的,但是其系数的绝对值是很小的。所以gdp的平方项对于居民的消费水平影响力是非常小的。
通过上面的比较,我们发现,没有办法具体比较哪个回归是更好的。鉴于凯恩斯模型以及其他的一些理论,我们下面主要讨论gdp和居民消费的线性函数关系。
(5) 双向因果关系
消费和收入之间的正相关关系反映了收入对消费的影响,但同时,他也反映了消费对收入的影响。从以上理论依据可以知道:不管由于什么样的原因,如果消费者决定增加支出,那么产出增加,因此收入增加。同时如果收入增加的话,消费者会决定增加消费的支出。所以HC和GDP之间存在互为因果的关系。根据理论:
HC=C0+c1Y;
Y=C+I+G+X-IM;若存在着互为因果的关系的话,自变量会和误差项相关。下面我们来寻找工具变量:工具变量和误差项无关和自变量有关,即找到外生变量,既影响收入,但又
11