第十章 时间序列截面数据模型 下载本文

第十章 时间序列/截面数据模型

2、面板工作文件视图

与普通工作文件相比面板工作文件的视图主要有两个突出的变化:工作文件最上方的关于数据区间和样本区间信息显示的变化以及识别各观测值的标签的变化。

(1)数据和样本区间

面板工作文件在视图方面的一个主要变化体现在工作文件窗口最上方的数据和样本区间描述上。

EViews在时期面板工作文件窗口的最上方的信息栏中给出了观测数据的起止时期、截面成员个数以及观测值的总数。例如,上面例子所对应的信息栏如下:

其中的样本区间便是观测值的起始时期——1991-2003。

相应地,在非时期面板工作文件窗口最上方的信息栏中EViews除给出数据和样本区间(1——观测值总数)外,还在数据区间信息后面给出截面成员数和截面成员所包含的最多观测值数。假设,工作文件中共有92个截面成员,截面成员中最多含有30个观测值,观测值的总数为506。那么该工作文件对应的信息栏如下:

值得注意的是,由于非时期面板没有数据对的概念,因此仍使用原有的观测值个数来作为样本区间的上限,即样本区间为:1—506。

总之,在任何时候我们都可以通过双击工作文件窗口上方的“Range”行或选择Poc/WF Structure&Range…打开工作文件结构对话框,对工作文件的结构结果进行适当的修改。

(2)观测值标签

打开普通工作文件中的序列后,我们可以在视图的左手边看到对应于每个观测值的标签列。在简单的未指定结构的工作文件中,这些标签便是一些简单的整数列(从1到工作文件中观测值的总数)。而在时期非面板工作文件中,这些标签便是与观测值相对应的日期序列。例如,在数据区间为1991-2003的年度工作文件中,观测值的标签列便是1991、1992、1993……。

而在面板工作文件中的观测值标识具有二维信息,标签应该既反映观测值的截面信息又反映观测值的截面内信息即时期信息,因此,EViews用截面ID和单元ID的联合形式作为每个观测值的标签。例如,我们用FCODE作为截面ID,用DATEID作单元ID,则在相应的年度面板工作文件中的观测值标签便为FCODE和DATEID的联合形式。

一般来说观测值标签的格式是与截面ID和单元ID的显示格式相对应的。例如,上例中FCODE

37

第二部分 基本单方程分析

所表示的截面ID部分含有两个字母,在观测值标签中也含有相应的两个字母。但是,值得注意的是,

有时观测值标签中不一定包含单元ID的所有显示部分,例如,我们的工作文件是年度面板结构的,由于已经给定了工作文件的结构,因此EViews便会利用给定的结构信息在观测值标签中用一个两位数来表示相应的年份,这样可以缩短观测值标签的时期部分。从上面的例子窗口中我们可以看出观测值标签并没有包含DATEID序列的全部信息,而是依照工作文件的时期结构用一个两位数来表示对应的时期。我们也可以通过改变相应ID序列(FCODE和DATEID序列)的显示形式来改变观测值标签的显示格式。打开相应的ID序列窗口,单击属性(Properties)按钮之后,便可以根据需要在显示属性表单下对序列中显示的有效数字等显示属性进行修改。

3、面板工作文件信息

时刻了解工作文件的结构对于处理面板数据是非常重要的。我们可以通过EViews提供的工具来获取工作文件结构方面的一些信息。

(1)工作文件结构

通过工作文件中的统计视图我们可以很方便地检验面板工作文件的结构。选择主菜单中的View/Statistics…可以获得工作文件内容和结构的摘要信息。下面给出对应上面例子的摘要信息:

Workfile Statistics

Date: 10/01/04 Time: 13:04 Name: CS

Number of pages: 1 Page: cs

Workfile structure: Panel - Annual Indices: FCODE x DATEID Panel dimension: 29 x 13

Range: 1991 2003 x 29 -- 377 obs Object series alpha coef Total

38

Count

4 1 1 6

Data Points

1508 377 751 2636

第十章 时间序列/截面数据模型

从显示信息中我们可以看出,该信息所对应的工作文件页的名字为“CS”,文件是一个年度面板工作文件,FCODE、DATEID分别为其对应的截面ID和单元ID。文件中含有29个截面成员,每个截面成员内部含有1991年—2003年的13个观测值。如果文件中的数据是非平衡的,那么信息中所给出的截面成员内部观测值数指的是每个截面成员内部所含有的最多观测值数。

选择主菜单中的View/Workfile Directory…,便可以重新回到最初的工作文件界面下。 (2)标识指针

我们可以利用EViews在面板工作文件中所提供的序列表达式和函数来获取关于截面ID、单元ID以及标识每个观测值的观测值ID的信息。

① 截面指针

表达式@CROSSID为每个观测值提供一个指针来标识其所属的截面成员。例如,在前面所介绍的工作文件例子中含有29个截面成员的377个观测值,因此,以用整数1到29来做为标识截面成员的指针。通过命令:series cxid = @crossid 将377个观测值所对应的标识截面的整数放在生成的序列CXID中,即第一个截面成员中的观测值在序列CXID中对应的指针值为1,第二个截面成员中的观测值在序列CXID中对应的指针值为2,依此类推。

打开CXID序列,选择View/One-way Tabulation…,可以得到如下形式的统计信息:

Tabulation of CXID

Date: 10/01/04 Time: 13:22 Sample: 1991 2003 Included observations: 377 Number of categories: 29

Value 1 2 3 4 … 22 23 24 25 26 27 28 29 Total

Count 13 13 13 13 … 13 13 13 13 13 13 13 13 377 Percent 3.45 3.45 3.45 3.45 … 3.45 3.45 3.45 3.45 3.45 3.45 3.45 3.45 100.00

Cumulative Cumulative Count 13 26 39 52 … 286 299 312 325 338 351 364 377 377 Percent 3.45 6.90 10.34 13.79 … 75.86 79.31 82.76 86.21 89.66 93.10 96.55 100.00 100.00

信息中给出了各截面成员所包含的观测值数及其在总观测值中所占的比重。 ② 单元(时期)指针

类似地,表达式 @CELLID为各观测值提供一个指针来标识其在工作文件的总时期中的位置(单

39

第二部分 基本单方程分析

元ID)。@CELLID给各观测值所对应的单元(或时期)ID赋一个整数值做为该观测值的单元指针,相同的单元(或时期)ID对应同一个单元指针,在整个工作文件中单元指针是连续的,但在截面成员内部允许观测值的单元指针是非连续的。

例如,我们假设有一个含有两个截面成员的面板工作文件,其中截面成员A有5个观测值,观测值所对应的单元ID值分别为:1991、1992、1993、1994和1999;截面成员B中有3个观测值,其所对应的单元ID值分别为:1993、1996和1998。可见,工作文件中共有7个单元ID值(1991、1992、1993、1994、1996、1998、1999),即从单元ID角度将数据分为7类,因此我们可以用1、2、3、4、5、6和7做为单元指针依次对应七个单元ID。通过命令:series cellid = @cellid将各观测值的单元指针按截面成员顺序放在生成的序列CELLID中。截面成员A中的观测值在序列CELLID中对应的值依次为1、2、3、4和7,截面成员B中的观测值在序列CELLID中对应的值依次为3、5和6。打开CELLID序列,选择View/One-way Tabulation…,可以得到同CXID序列类似的统计信息。

③ 观测值截面内指针

同样,表达式 @OBSID为截面成员内的各观测值提供了一个整数作为标识该观测值在所属截面成员中的位置的指针。具体为:用从1开始的连续的整数作为各观测值的截面内指针,对于每个截面成员,与其对应的截面内指针的最大值为该截面所含有的观测值个数。

我们可以看出,@CELLID在建立指针时考虑的是单元ID所对应的所有观测值,而@OBSID在建立指针时仅仅考虑截面成员内部的观测值个数。因此不同截面成员中同一位置的不同观测值对应着相同的@OBSID值,并且在不同截面成员中相同单元ID对应的不同观测值的@CELLID值相同。当然,如果面板工作文件的数据是平衡的,即每个截面成员中的观测值对应的单元ID都相同,@OBSID和@CELLID应该具有完全相同的结果。

④工作文件观测值指针

如果我们希望了解从第一个截面成员的第一个观测值到最后一个截面成员的最后一个观测值的信息,我们可以利用命令:series _id = @obsnum。关键字@OBSNUM允许我们用从1开始的连续整数标识工作文件中的所有观测值。

4、面板数据的处理

一般情况下,面板工作文件中数据的处理与其它文件中的数据处理过程是一致的。下面主要介绍面板工作文件与其它工作文件在数据处理上的不同之处,并介绍一些利用普通、非面板工具面板数据进行处理的有效方法。

(1)、面板样本

时期工作文件和非时期工作文件具有不同的样本说明形式。 ① 时期面板样本

在时期面板工作文件中,我们可以利用与非面板工作文件相同的方法定义样本区间,即用一个时期对来表示其样本区间,或使用条件语句来定义样本区间。

除此之外,还可以利用一些表示截面成员首位和末位的特殊关键字来定义样本区间。 在时期面板工作文件中,关键字@FIRST和@LAST分别表示截面成员的首位和末位。例如,样本定义语句:smpl @first 2000,表示用于估计的样本为:从各截面成员的第一个观测值开始到对应时期为2000年的观测值之间的所有观测值。

而样本定义语句:smpl @first @first+5 和 smpl @last-5 @last 表示的样本分别为:每个截面成员的前五个观测值和每个截面成员的最后五个观测值。

40