统计学第四版贾俊平人大 - 回归与时间序列stata - 图文 下载本文

.word格式,

可得线性函数(GDP为自变量,cspt为因变量):y=0.3086827x+734.6928,即β0=734.6928,表示回归直线的截距为734.6928;β1=0.3086827,表示人均GDP(x)变化1元引起人均消费水平(y)的变化为0.3086827元。

(4)由(3)得到的结果可得 =0.9963,判定系数 测度了回归直线对观测数据的拟合程度,即在人均消费水平的变差中,有99.63%可以由人均消费水平与人均GDP之间的线性关系解释,或者说,在人均消费水平取值的变动中,有99.63%由人均GDP决定。可见,两者之间有很强的线性关系。

(5)由(3)得到的结果可得回归方程线性关系的F检验值1331.69对应的检验P值为0.0000<α=0.05,故拒绝原假设,即人均消费水平和人均GDP之间存在显著的正相关性。 (6)x=5000时,E(y)=0.3086827*5000+734.6928=2278.1063。

(7)x=5000时,输入命令predictnl PT=predict(xb),ci(lb ub) l(95),得到各人均GDP水平下的置信区间,如下图:

输入如下命令,得到置信区间和预测区间示意图: predict yhat

predict stdp, stdp predict stdf, stdf

generate zl = yhat - invttail(5,0.025)*stdp generate zu= yhat + invttail(5,0.025)*stdp generate yl = yhat - invttail(5,0.025)*stdf generate yu = yhat + invttail(5,0.025)*stdf

twoway (lfitci cspt GDP, level(95)) (scatter cspt GDP) (line zl zu yl yu GDP, pstyle(p2 p2 p3 p3) sort)

, 专业.专注 .

.word格式,

取cspt=y,GDP=x,y0为x0=5000的预测值,x1为GDP平均值,x2=(x0-x1)^2,x3= sum((x-x1)^2)

, , y0=0.3086827*5000+734.6928=2278.1063,

egen x1=mean(x),得到x1=12248.429,

gen x2=(5000-12248.429)^2,得到x2= 52539722.968, egen x3= sum((x-x1)^2),得到x3=854750849.7143

display y0+2.7764*247.3*sqrt(1/7+x2/x3),得zu= 2588.4671 display y0-2.7764*247.3*sqrt(1/7+x2/x3),得zl= 1967.7455 display y0+2.7764*247.3*sqrt(1+1/7+x2/x3),得yu= 3031.5972 display y0+2.7764*247.3*sqrt(1+1/7+x2/x3),得yl= 1524.6154

即人均GDP为5000元时,人均消费水平95%的置信区间为[1967.7455, 2588.4671],预测区间为[1524.6154, 3031.5972]。

11.7 (1)编辑数据集,命名为linehuigui5.dat

输入命令scatter cmplts percent,xlabel(#5, grid) ylabel(#5, grid),得到如下散点图,可以看到,时间和距离是负线性相关的关系。

(2)输入命令reg cmplts percent得到下图:

, 专业.专注 .

.word格式,

可得线性函数(percent为自变量,cmplts为因变量):y=-4.700623x+430.1892,即β0=430.1892,表示回归直线的截距为430.1892;β1=-4.700623,表示航班正点率percent提高1%使投诉次数cmplts的减少-4.700623次。

(3)由(2)得到的结果可得回归系数检验的t值-4.96对应的P值为0.001<α=0.05,故拒绝原假设,即航班正点率percent是投诉次数cmplts的一个显著因素(或者输入test percent=0)。

(4)x=80时,E(y)=-4.700623*80+430.1892=54.13936次。

(5)x=80时,输入命令predictnl PT=predict(xb),ci(lb ub) l(95),得到各航班正点率水平下的置信区间,如下图:

输入如下命令,得到置信区间和预测区间示意图: predict yhat

predict stdp, stdp predict stdf, stdf

generate zl = yhat - invttail(8,0.025)*stdp generate zu= yhat + invttail(8,0.025)*stdp generate yl = yhat - invttail(8,0.025)*stdf generate yu = yhat + invttail(8,0.025)*stdf

twoway (lfitci cmplts percent, level(95)) (scatter cmplts percent) (line zl zu yl yu percent, pstyle(p2 p2 p3 p3) sort)

, 专业.专注 .

.word格式,

取cmplts=y,percent=x,y0为x0=80的预测值,x1为percent平均值,x2=(x0-x1)^2,x3= sum((x-x1)^2)

, , y0=-4.700623*80+430.1892=54.13936,

egen x1=mean(x),得到x1=12248.429, gen x2=(80- 75.86)^2,得到x2= 17.1396, egen x3= sum((x-x1)^2),得到x3= 397.024

display y0+2.3060*18.887*sqrt(1/10+x2/x3),得zu= 70.619033 display y0-2.3060*18.887*sqrt(1/10+x2/x3),得zl= 37.659687 display y0+2.3060*18.887*sqrt(1+1/10+x2/x3),得yu= 100.7063 display y0-2.3060*18.887*sqrt(1+1/10+x2/x3),得yl= 7.5724171

即航班正点率为80%时,投诉次数的95%的置信区间为[37.659687, 70.619033],预测区间为[7.5724171, 100.7063]。

11.8 (1)打开一张EXCEL表格,输入数据如下:

(2)数据|分析|数据分析|回归,弹出回归对话框并设置如下:

(3)单击“确定”得如下输出结果:

, 专业.专注 .