表9
参数都具有显著性意义,最优回归子集模型的回归模型为:
Y=2.1435.4E-16-0.06508x2+0.98957x3+0.4486x5
4.7最佳子集回归
程序10
proc reg data=out1;
model y=x1-x6/selection=cp aic adjrsq; run;
结果:
表10
基于Cp统计量x2 x3 x5是最优子集,与逐步回归选元结果相同。
4.8岭回归
程序11 :
proc reg data=out1 outest=z4 outvif; model y=x1-x6/ridge=0 to 1 by 0.1; plot/ridgeplot; run;
proc print data=z4; run;
结果:
O_MO_TYP_DEP_RI_PCO_RMbDELE_ VAR_ DGEMIT_ SE_ s _ _
1 MODPARMy .
. 0.0EL1 S 8027 2 MODRIDGy 0.0
.
.
EL1 EVIF 3 MODRIDGy 0.0
. 0.0EL1 E 8027 4 MODRIDGy 0.1
.
.
EL1 EVIF 5 MODRIDGy 0.1
. 0.1EL1 E 3652 6 MODRIDGy 0.2
.
.
EL1 EVIF 7 MODRIDGy 0.2
. 0.1EL1 E 8666 8 MOD
RIDGy
0.3
.
.
Interx1 cept
2.5310.14E-16 171 . 67.4189 2.5310.14E-16 171 . 0.7185 4.4920.37E-16 201 . 0.3093 5.1910.38E-16 065 . 0.2x2 x3 -0.10.81696 729 6.6134.761 0070 -0.10.81696 729 0.981.0505 867 -0.20.50094 631 0.720.5040 592 -0.10.48767 961 0.57
0.3
x4 x5 0.00.0166 4690 14.1.55457778 4 0.00.0166 4690 1.71.0706 0233 0.10.0137 5192 0.70.7525 8126 0.10.0513 5604 0.4
0.6
x6 y
0.0-1021 2 1.6-8301
5
0.0-1021
2 1.0-1251
8
0.0-0831
6 0.7-7951
1
0.0-1341
6 0.6-
O_MObDELs _ _TYP_DEP_RI_PCO_RMInterE_ VAR_ DGEMIT_ SE_ cept
_
x1 x2 x3 x4 x5 x6 y
EL1 EVIF 9 MODRIDGy EL1 E 0.3
062 822 852 329 3272891
6 0
. 0.25.4630.20.010.40.10.00.0-3093E-16 925 699 536 658 5991931
4 1 2 1MODRIDG0 EL1 EVIF 1MODRIDG1 EL1 E 1MODRIDG2 EL1 EVIF 1MODRIDG3 EL1 E 1MODRIDG4 EL1 EVIF 1MODRIDG5 EL1 E 1MODRIDG6 EL1 EVIF 1MODRIDG7 EL1 E 1MODRIDG8 EL1 EVIF 1MODRIDG9 EL1 E
y 0.4
y 0.4
y 0.5
y 0.5
y 0.6
y 0.6
y 0.7
y 0.7
y 0.8
y 0.8
.
.
. 0.27039 .
.
. 0.30575 .
.
. 0.33767 .
.
. 0.36667 .
.
. 0.39321 . 0.1594 5.5790.27E-16 800 . 0.1319 5.6250.2E-16 688 . 0.1135 5.6330.22E-16 589 . 0.1001 5.6200.24E-16 499 . 0.0899 5.5950.23E-16 417 0.480.2131 968 -0.10.45313 218 0.400.2938 422 -0.10.33800 960 0.350.2358 046 -0.10.32466 744 0.300.1908 768 -0.10.31293 558 0.270.1286 554 -0.10.30262 395 0.20.5914 2559 0.10.0718 6285 0.20.4157 4495 0.10.0740 6494 0.10.3701 8241 0.10.0742 6636 0.10.3401 3275 0.10.0732 6727 0.10.2191 9256 0.10.0715 6778 0.5-2161
1
0.0-2431
9 0.4-4131
1
0.0-2851
3 0.3-7921
1
0.0-3181
7 0.3-2991
6
0.0-3451
3 0.2-9011
4
0.0-3661
5
O_MObDELs _ _TYP_DEP_RI_PCO_RMInterE_ VAR_ DGEMIT_ SE_ cept
_
0.9
.
.
x1 x2 x3 x4 x5 x6 y
2MODRIDGy 0 EL1 EVIF 2MODRIDGy 1 EL1 E 2MODRIDGy 2 EL1 EVIF 2MODRIDGy 3 EL1 E
. 0.00.240.10.10.20.2-816 289 384 036 5955741
2 1
0.9
. 0.45.5620.2-0.00.30.10.00.0-1766E-16 342 9353 250 694 6793831
3 9 3 .
.
. 0.00.210.10.00.20.2-749 778 245 918 3193011
7 3
1.0
1.0
. 0.45.5250.2-0.00.30.10.00.0-4023E-16 272 8548 120 671 6793961
4 7 6
表11
图2
由岭迹图,当K>=0.3,岭迹曲线趋于稳定,说明K=0.3即可以满足岭回归参数估计的均
方误差较小的要求,对应的岭回归估计的回归方程:
Y=0.2925x1+0.01699x2+0.4536x3+0.1658x4+0.05991x5+0.01932x6