应用线性回归课后作业
姓名:xxx
学号:xxxxxxxxx 年级:2013级
指导老师:xxx
第2章
2.14为了调查某广告对销售收入的影响,某商店记录了5个月的销
售收入y(万元)和广告费用x(万元),数据如表2-6所示 月份 x y 1 1 10 2 2 10 3 3 20 4 4 20 5 5 40 (表2-6) (1) 画散点图:
解:
> x <- c(1,2,3,4,5)
> y <- c(10,10,20,20,40) > plot(x,y)
101152025y30354023x45
(2)x与y之间是否大致呈线性关系:
解:
由上题的散点图可以看出五个点基本在一条直线附近,因此可以看出x与y之间大致呈线性关系
(3)用最小二乘估计求出回归方程:
解:R语言程序如下
> mystat1 <- data.frame(x,y) > mystat1 x y 1 1 10 2 2 10 3 3 20 4 4 20 5 5 40
> regress1 <- lm(y~x,data=mystat1) > summary(regress1)
Call:
lm(formula = y ~ x, data = mystat1)
Residuals:
1 2 3 4 5 4.000e+00 -3.000e+00 5.004e-16 -7.000e+00 6.000e+00
Coefficients:
Estimate Std. Error t value Pr(>|t|) (Intercept) -1.000 6.351 -0.157 0.8849 x 7.000 1.915 3.656 0.0354 * ---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 6.055 on 3 degrees of freedom
Multiple R-squared: 0.8167, Adjusted R-squared: 0.7556 F-statistic: 13.36 on 1 and 3 DF, p-value: 0.03535
? 得出回归方程为:y=-x+7
(4)求回归标准误差: 解:
? 从上述分析看出=6.055
(5)给出的置信度为95%的区间估计: 解:
> confint(regress1)
2.5 % 97.5 % (Intercept) -21.2112485 19.21125 x 0.9060793 13.09392
? 得出置信度为95%的区间估计为(-21.2112485,19.21125)
置信度为95%的区间估计为(0.9060793,13.09392)
(6)计算x 与y的决定系数: 解:
? 由第三问的分析看出:R^2=0.8167,接近1,表明原方程的拟合程度较好。
(7)对回归方程作方差分析: 解:
> anova(regress1)
Analysis of Variance Table
Response: y
Df Sum Sq Mean Sq F value Pr(>F) x 1 490 490.00 13.364 0.03535 * Residuals 3 110 36.67 ---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(8)作回归系数:
解:
? 同样从第三问的分析可以看出的p值为0.0354,在显著性水平为0.05时,
影响显著。
(9)作相关系数的显著性检验: 解:
> sqrt(0.8167) [1] 0.9037146
? 相关系数为0.9037146,查表知,x与y有显著的线性关系
(10)对回归方程作残差图并作相应的分析: 解:>y2 <- regress1$residuals
> plot(x,y2,type='b',pch=15,lty=3) > y3 <- c(0,0,0,0,0)
> lines(x,y3,type='b',pch=20,lty=1)
y2-6-4-20246123x45 ? 由残差图可以看出残差在0附近随机变化,并在变化幅度不大的一个区域内。
(11) 求当广告费用为4.2万元时,销售收入将达到多少,并给出置信度为95%的置信区间: 解:
> new2 <- data.frame(x=4.2)
> pred <- predict(regress1,new2,interval=\> pred
fit lwr upr 1 28.4 6.059318 50.74068
? 当x为4.2时,预测值为28.4,置信度为95%的置信区间为
[6.059318,50.74068]
2.15一家保险公司十分关心其总公司营业部加班的程度,决定认
真调查一下现状。经过10周时间,收集了每周加班时间的数据和签发的新保单书目,y为每周加班时间(小时),数据如表2-7所示。 (1)画散点图:
解:R语言程序如下
>
x
<-
表2-7
c(825,215,1070,550,480,920,1350,325,670,1215) > y <- c(3.5,1.0,4.0,2.0,1.0,3.0,4.5,1.5,3.0,5.0) > plot(x,y)
周序号 x 1 2 3 4 5 6 7 8 9 10 825 215 1070 550 480 920 1350 325 670 1215 y 3.5 1.0 4.0 2.0 1.0 3.0 4.5 1.5 3.0 5.0 120023y45400600800x10001200
(2)x与y之间是否大致呈线性关系: 解:
? 由图可以看出y与x大致呈线性关系
(3)用最小二乘估计求出回归方程: 解:
> mystat <- data.frame(x,y) > mystat x y 1 825 3.5 2 215 1.0 3 1070 4.0 4 550 2.0 5 480 1.0 6 920 3.0 7 1350 4.5 8 325 1.5 9 670 3.0 10 1215 5.0
> regress2 <- lm(y~x,data=mystat) > summary(regress2)
Call:
lm(formula = y ~ x, data = mystat)
Residuals:
Min 1Q Median 3Q Max -0.83899 -0.33483 0.07842 0.37228 0.52594
Coefficients:
Estimate Std. Error t value Pr(>|t|) (Intercept) 0.1181291 0.3551477 0.333 0.748 x 0.0035851 0.0004214 8.509 2.79e-05 *** ---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.48 on 8 degrees of freedom
Multiple R-squared: 0.9005, Adjusted R-squared: 0.8881 F-statistic: 72.4 on 1 and 8 DF, p-value: 2.795e-05
利用最小二乘法手算:
设一元线性回归方程为 要使得参数满足
.004
? 看出两种结果相同,即回归方程为y=0.1181291+0.0035851*x
(4)求回归标准误差: 解:
? 从第三问看出回归标准误差为0.48
(5)给出的置信度为95%的区间估计:
解:
> confint(regress2)
2.5 % 97.5 % (Intercept) -0.700843004 0.937101152 x 0.002613486 0.004556779
? a0的置信度为95%的区间估计为[-0.700843004,0.937101152]
a1的置信度为95%的区间估计为[0.002613486,0.004556779]
(6)计算x与y的决定系数: 解:
? 决定系数为R^2=0.9005
(7)对回归方程作方差分析: 解:
> anova(regress2)
Analysis of Variance Table
Response: y
Df Sum Sq Mean Sq F value Pr(>F) x 1 16.6816 16.6816 72.396 2.795e-05 *** Residuals 8 1.8434 0.2304 ---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
? 以上为对回归方程作方差分析,可以看出F值为72.396,显著性p值为2.795e-05,表明回归方程高度显著。
(8)作回归系数的显著性检验:
解:
? 因此拒绝原假设,认为y与x有显著的线性关系,并且从第三问的分析中看出,回归系数的P值为 2.795e-05,远小于显著性水平,故影响显
著
(9)作相关系数的显著性检验: 解:
> sqrt(0.9005) [1] 0.9489468
? 相关系数为0.9489468,查表知,大于显著性水平为0.01时的值,故x与y有高度的显著性关系
(10)对回归方程作残差图并作相应分析: 解:
> y2 <- regress2$residuals
> plot(x,y2,type='b',pch=15,lty=3) > y3 <- c(0,0,0,0,0,0,0,0,0,0)
> lines(x,y3,type='b',pch=20,lty=1)
y2-0.8200-0.6-0.4-0.20.00.20.4400600800x10001200
? 由残差图可以看出残差在0附近随机变化,并在变化幅度不大的一个区域内
(11)该公司预计下一周签发新保单张,需要加班时间是多少? 解:
> new2 <- data.frame(x=1000)
> pred <- predict(regress2,new2,interval='prediction') > pred
fit lwr upr 1 3.703262 2.51949 4.887033
? 由回归方程预测的当x=1000时,需要的加班时间为3.7(小时)
(12) 给出的置信度为95%的精确预测区间和近似预测区间: 解:
> new3 <- data.frame(x=825)
> pred2 <- predict(regress2,new3,interval='prediction') > pred2
fit lwr upr 1 3.075863 1.913287 4.23844 > sigma <- c(0.48) > 3.075863+2*sigma [1] 4.035863
> 3.075863-2*sigma [1] 2.115863
? y0的置信度为95%的精确预测区间为[1.913287,4.23844]
y0的置信度为95%的近似预测区间为[2.115863,4.035863]
2.16
表2-8是1985年美国50个州和哥伦比亚特区公立学校中教师的人均年工资y(美元)和对学生的人均经费投入x(美元)
序号 1 y 19583 x 3346 序号 18 y 20816 x 3059 序号 35 y 19538 x 2642 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 20263 20325 26800 29470 26610 30678 27170 25853 24500 24274 27170 30168 26525 27360 21690 21974 3114 3554 4542 4669 4888 5710 5536 4168 3547 3159 3621 3782 4247 3982 3568 3155 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 18095 20939 22644 24624 27186 33990 23382 20627 22795 21570 22080 22250 20940 21800 22934 18443 2967 3285 3914 4517 4349 5020 3594 2821 3366 2920 2980 3731 2853 2533 2729 2305 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 20460 21419 25160 22482 20969 27224 25892 22644 24640 22341 25610 26015 25788 29132 41480 25845 3124 2752 3429 3947 2509 5440 4042 3402 2829 2297 2932 3705 4123 3608 8349 3766 (1) 绘制y对x的散点图。可以用直线回归描述两者之间的关系吗?
解:R语言如下:
>mystat<-
read.table('C:/Users/Administrator/Desktop/1.csv',header=T,sep=',') > mystat
y x 1 19583 3346 2 20263 3114 3 20325 3554 4 26800 4542 5 29470 4669 6 26610 4888 7 30678 5710 8 27170 5536 9 25853 4168 10 24500 3547 11 24274 3159 12 27170 3621 13 30168 3782 14 26525 4247 15 27360 3982 16 21690 3568
17 21974 3155 18 20816 3059 19 18095 2967 20 20939 3285 21 22644 3914 22 24624 4517 23 27186 4349 24 33990 5020 25 23382 3594 26 20627 2821 27 22795 3366 28 21570 2920 29 22080 2980 30 22250 3731 31 20940 2853 32 21800 2533 33 22934 2729 34 18443 2305 35 19538 2642 36 20460 3124 37 21419 2752 38 25160 3429 39 22482 3947 40 20969 2509 41 27224 5440 42 25892 4042 43 22644 3402 44 24640 2829 45 22341 2297 46 25610 2932 47 26015 3705 48 25788 4123 49 29132 3608 50 41480 8349 51 25845 3766
> regress3 <- lm(y~x,data=mystat) > summary(regress3)
Call:
lm(formula = y ~ x, data = mystat)
Residuals:
Min 1Q Median 3Q Max -3849.9 -1853.0 -219.1 1654.3 5522.3
Coefficients:
Estimate Std. Error t value Pr(>|t|) (Intercept) 12112.629 1197.768 10.11 1.39e-13 *** x 3.314 0.312 10.62 2.62e-14 *** ---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 2323 on 49 degrees of freedom
Multiple R-squared: 0.6972, Adjusted R-squared: 0.691 F-statistic: 112.8 on 1 and 49 DF, p-value: 2.621e-14
> x <- mystat$x > x
[1] 3346 3114 3554 4542 4669 4888 5710 5536 4168 3547 3159 3621 3782 4247 [15] 3982 3568 3155 3059 2967 3285 3914 4517 4349 5020 3594 2821 3366 2920 [29] 2980 3731 2853 2533 2729 2305 2642 3124 2752 3429 3947 2509 5440 4042 [43] 3402 2829 2297 2932 3705 4123 3608 8349 3766 > y <- mystat$y > y
[1] 19583 20263 20325 26800 29470 26610 30678 27170 25853 24500 24274 27170
[13] 30168 26525 27360 21690 21974 20816 18095 20939 22644 24624 27186 33990
[25] 23382 20627 22795 21570 22080 22250 20940 21800 22934 18443 19538 20460
[37] 21419 25160 22482 20969 27224 25892 22644 24640 22341 25610 26015 25788
[49] 29132 41480 25845 > plot(x,y)
200002500030000y3500040000300040005000x600070008000
? 由散点图看出,可以大致用直线回归描述两者的关系
(2)建立y对x的线性回归: 解:
? 由上题的结果得出,线性回归方程为:y=3.314*x+12112.629
(3) 用线性回归的Plots功能绘制标准化残差的直方图和正态概率图,检验误差项的正态性假设: 解:
>z <- regress3$residuals >p <- z/2323 > p
1 2 3 4 5 6 -1.55740164 -0.93371749 -1.53470915 -0.15679500 0.81140917 -0.73217153
7 8 9 10 11 12 -0.15361048 -1.41550729 -0.03092841 0.27252163 0.72873441 1.31633286 13 14 15 16 17 18 2.37723111 0.14565537 0.88313968 -0.96707859 -0.25565840 -0.61720308 19 20 21 22 23 24 -1.65729081 -0.88665425 -1.04998848 -1.05785105 0.28469328 2.25645048 25 26 27 28 29 30 -0.27580036 -0.35904488 -0.20323781 -0.09433258 0.03961821 -0.95853839 31 32 33 34 35 36 -0.26995487 0.55675155 0.76530993 -0.56310950 -0.57248308 -0.86317884 37 38 39 40 41 42 0.08032540 0.72496971 -1.16680198 0.23326163 -1.25531284 0.16560532 43 44 45 46 47 48 -0.31959571 1.35705027 1.12630547 1.62767928 0.69930090 0.00528521 49 50 51 2.17947549 0.73174986 0.53910022 > hist(p)
Histogram of p10Frequency0-22468-10p12
? 上图为标准化残差的直方图
? 上图为标准化残差的正态概率图,看出散点基本呈直线趋势,可以认为检验误差项服从正态分布。 > shapiro.test(regress3$residuals)
Shapiro-Wilk normality test
data: regress3$residuals W = 0.96793, p-value = 0.1812
? 作正态假设检验可以看出,P值为0.1812,故不能拒绝误差项服从正态分布的假设,即可以认为误差项服从正态分布。
第三章
3.11研究货运总量y(万吨)与工业总产值x1(亿元),
农业总产值x2(亿元),居民非商品支出x3(亿元)的关系。数据如下表所示。
编号 货运总量y(万吨) 160 260 210 265 240 220 275 160 275 250 工业总产值x1(亿元) 70 75 65 74 72 68 78 66 70 65 农业总产值x2(亿元) 35 40 40 42 38 45 42 36 44 42 居民非商品支出x3(亿元) 1.0 2.4 2.0 3.0 1.2 1.5 4.0 2.0 3.2 3.0 1 2 3 4 5 6 7 8 9 10 (1) 计算出y,的相关系数矩阵。 解:用R软件计算
> y <- c(160,260,210,265,240,220,275,160,275,250) > x <- c(70,75,65,74,72,68,78,66,70,65) > z <- c(35,40,40,42,38,45,42,36,44,42)
> w <- c(1.0,2.4,2.0,3.0,1.2,1.5,4.0,2.0,3.2,3.0) > mystat1 <- data.frame(x,y,z,w) > mystat1
x y z w 1 70 160 35 1.0 2 75 260 40 2.4 3 65 210 40 2.0 4 74 265 42 3.0 5 72 240 38 1.2
6 68 220 45 1.5 7 78 275 42 4.0 8 66 160 36 2.0 9 70 275 44 3.2 10 65 250 42 3.0 > cor(mystat1)
y x1 x2 x3 y 1.0000000 0.5556527 0.7306199 0.7235354 x1 0.5556527 1.0000000 0.1129513 0.3983870 x2 0.7306199 0.1129513 1.0000000 0.5474739 x3 0.7235354 0.3983870 0.5474739 1.0000000 由上述可知,相关系数矩阵为
(2)求y关于的三元线性回归方程 解:
> regress1 <- lm(y~x+z+w,data=mystat1) > summary(regress1)
Call:
lm(formula = y ~ x + z + w, data = mystat1)
Residuals:
Min 1Q Median 3Q Max -25.198 -17.035 2.627 11.677 33.225
Coefficients:
Estimate Std. Error t value Pr(>|t|) (Intercept) -348.280 176.459 -1.974 0.0959 . x 3.754 1.933 1.942 0.1002 z 7.101 2.880 2.465 0.0488 * w 12.447 10.569 1.178 0.2835 ---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 23.44 on 6 degrees of freedom
Multiple R-squared: 0.8055, Adjusted R-squared: 0.7083 F-statistic: 8.283 on 3 and 6 DF, p-value: 0.01487
由程序分析看出:
y=-348.280+3.754+7.101+12.447
(3)对所求得的方程作拟合优度检验:
解:查看上题的程序得出:=0.806,可以认为回归方程对样本的拟合程度较高。
(4)对回归方程作显著性检验:
解:仍然根据上题的程序得出:p=0.01487,在显著性水平,方程显著,即整体对y的线性影响是显著的。
(5)对每一个回归系数作显著性检验:
解:根据上题的程序看出:的Sig.值分别为:0.1002,0.0488,0.2835,在显著性水平下,只有
(6)如果有的回归系数没通过显著性检验,将其剔除,重新建立回归方程,再作回归方程的显著性检验和回归系数的显著性检验: 解:从上题可以看出,和是不显著的,原则上每次先剔除一个变量,所以第一次先剔除p值最大的
> mystat2 <- data.frame(x,y,z) > mystat2 x y z 1 70 160 35
2 75 260 40 3 65 210 40 4 74 265 42 5 72 240 38 6 68 220 45 7 78 275 42 8 66 160 36 9 70 275 44 10 65 250 42
> regress12 <- lm(y~x+z,data=mystat2) > summary(regress12)
Call:
lm(formula = y ~ x + z, data = mystat2)
Residuals:
Min 1Q Median 3Q Max -42.012 -10.656 4.358 11.984 28.927
Coefficients:
Estimate Std. Error t value Pr(>|t|) (Intercept) -459.624 153.058 -3.003 0.01986 * x 4.676 1.816 2.575 0.03676 * z 8.971 2.468 3.634 0.00835 ** ---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 24.08 on 7 degrees of freedom
Multiple R-squared: 0.7605, Adjusted R-squared: 0.6921 F-statistic: 11.12 on 2 and 7 DF, p-value: 0.006718
? 可以看出将参量x3剔除后,回归方程p值为0.006718,在显著性水平为0.05
时高度显著,表明并且小于剔除之前的p值。
? 的p值为0.03676,0.00835,在显著性水平为0.05时都显著。
(7)求出每一个回归系数的置信水平为95%的置信区间。
解:> confint(regress12)
2.5 % 97.5 % (Intercept) -821.547 -97.700 x 0.381 8.970 z 3.134 14.808
? 得出a0的置信水平为95%的置信区间为(-821.547,-97.700) ? a1的置信水平为95%的置信区间为(0.381,8.970) ? a2的置信水平为95%的置信区间为(3.134,14.808)
(8)求标准化回归方程:
解:
> meanx <- mean(x) > meany <- mean(y) > meanz <- mean(z) > meanw <- mean(w) > for (i in 1:10)
+ Lxx <- (x[i]-mean(x))^2 > Lxx
[1] 28.09
> x2 <- (x-meanx)/sqrt(Lxx) > x2
[1] -0.05660377 0.88679245 -1.00000000 0.69811321 0.32075472 -0.43396226
[7] 1.45283019 -0.81132075 -0.05660377 -1.00000000 > for (i in 1:10)
+ Lyy <- (y[i]-mean(y))^2 > y2 <- (y-meany)/sqrt(Lyy) > y2
[1] -3.8648649 1.5405405 -1.1621622 1.8108108 0.4594595 -0.6216216 [7] 2.3513514 -3.8648649 2.3513514 1.0000000 > for (i in 1:10)
+ Lzz <- (z[i]-meanz)^2 > z2 <- (z-meanz)/sqrt(Lzz) > z2
[1] -3.375 -0.250 -0.250 1.000 -1.500 2.875 1.000 -2.750 2.250 1.000
> for (i in 1:10)
+ Lww <- (w[i]-meanw)^2 > w2 <- (w-meanw)/sqrt(Lww) > w2
[1] -1.9850746 0.1044776 -0.4925373 1.0000000 -1.6865672 -1.2388060 [7] 2.4925373 -0.4925373 1.2985075 1.0000000 > mystat2 <- data.frame(x2,y2,z2,w2)
> regress12 <- lm(y2~x2+z2+w2,data=mystat2) > summary(regress12)
Call:
lm(formula = y2 ~ x2 + z2 + w2, data = mystat2)
Residuals:
Min 1Q Median 3Q Max -1.3620 -0.9208 0.1420 0.6312 1.7960
Coefficients:
Estimate Std. Error t value Pr(>|t|) (Intercept) -1.392e-15 4.007e-01 0.000 1.0000 x2 1.075e+00 5.539e-01 1.942 0.1002 z2 6.141e-01 2.491e-01 2.465 0.0488 * w2 4.508e-01 3.828e-01 1.178 0.2835 ---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 1.267 on 6 degrees of freedom
Multiple R-squared: 0.8055, Adjusted R-squared: 0.7083 F-statistic: 8.283 on 3 and 6 DF, p-value: 0.01487
? 剔除x3之前的标准化回归方程为:
y=-1.392e-15+1.075x1+ 6.141e-01x2+4.508e-01x3
(9)求当时的,给定置信水平为95%,用SPSS软件计算精确置信区间,手工计算近似预测区间。 ? 用SPSS精确置信区间:
y 160 260 210 265 240 220 275 160 275 250 70 75 65 74 72 68 78 66 70 65 75 35 40 40 42 38 45 42 36 44 42 42 LICI_1 114.1804 186.7191 139.2701 200.9208 155.9556 195.3407 213.4631 105.138 199.0204 156.1113 204.4355 UICI_1 249.1279 313.0551 266.9915 325.3859 279.8809 328.6842 350.2487 238.7071 325.7651 286.0341 331.2225 预测值 181.6541 249.8871 203.1308 263.1534 217.9183 262.0125 281.8559 171.9226 262.3928 221.0727 267.829
? 的精确置信区间为(204.4355,331.2225)
> pred <- c(270.0897) > sigma <- c(23.44) > pred + 2*sigma [1] 316.0
> pred - 2*sigma [1] 219.6
(10)结合回归方程对问题作一些基本分析
解:
? 对于原始的方程来说,x3的回归系数显著性未通过,因此可以认为居民非商
品支出x3对货运总量影响不大。 ? 由剔除变量x3的回归方程看出:
农业总产值固定的时候,工业总产值每增加一个单位,货运总量y增加4.676个单位。
工业总产值固定的时候,农业总产值每增加一个单位,货运总量y增加8.971个单位。
3.12
用表3-10的数据,建立GDP对和的回归。对得到的二元回归
方程,你能够合理地解释两个回归系数吗?
年份 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 GDP 18667.8 21781.5 26923.5 35333.9 48197.9 60793.7 71176.6 78973.0 84402.3 89677.1 99214.6 109655.2 120332.7 135822.8 第一产业增加值 5062.0 5342.2 5866.6 6963.8 9572.7 12135.8 14015.4 14441.9 14817.6 14770.0 14944.7 15781.3 16537.0 17381.7 第二产业增加值 7717.4 9102.2 11699.5 16454.4 22445.4 28679.5 33835.0 37543.0 39004.2 41033.6 45555.9 49512.3 53896.8 62436.3 第三产业增加值 5888.4 7337.1 9357.4 11915.7 16179.8 19978.5 23326.2 26988.1 30580.5 33873.4 38714.0 44361.6 49898.9 56004.7 2004 2005 2006 2007 2008 2009 2010 2011 2012 159878.3 184937.4 216314.4 265810.3 314045.4 340902.8 401512.8 473104.0 518942.1 21412.7 22420.0 24040.0 28627.0 33702.0 35226.0 47486.2 47486.2 52373.6 73904.3 87598.1 103719.5 125831.4 149003.4 157638.8 220412.8 220412.8 235162.0 64561.3 74919.3 88554.9 111351.9 131340.0 148038.0 173596.0 205205.0 231406.5 解: 1) 所得到的二元回归方程为
? 当固定第二产业增加值,第一产业每增加一个单位,GDP就增加
0.7983个单位。
? 在固定第一产业增加值,第二产业每增加一个单位,GDP就增加
2.0014个单位。
? 但是从表中可知,以1990年为例,第一、二产业增加一个单位,实
际上GDP增加了3113.7亿元,是因为y的变化还与对y起的作用还与的值有关,这是由于各因素之间的“交互作用”,因此回归系数并不能完全看成是自变量和应变量改变的关系。