当前位置:首页 > 第15章 工具变量与两阶段最小二乘
以看出你是否在内生性检验中做了正确的回归。它还对2SLS给出了另一个解释:在(15.51)的OLS回归
?2包括进来而清理出了y2的内生性(指把y2的内生部分清理了出来——译者)中把v。
我们还可以检验复解释变量的内生性。对于每个被怀疑的内生变量,我们如第(i)部分那样获得诱导型残差。然后,我们用F检验在结构方程中检验这些残差的联合显著性。联合显著性表明至少有一个被怀疑的解释变量是内生的。被检验的排斥性约束的数目就是被怀疑的内生解释变量的数目。
检验过度识别约束
当我们在第15.1节中介绍简单的工具变量估计量时,我们强调IV必须满足两个必需条件:它必须与误差不相关,与内生解释变量相关。我们在相当复杂的模型中已看到,如何判断在诱导型回归中是否能用一个t或F检验来检验第二个必需条件。我们声称第一个必需条件不能被检验,因为它涉及到IV与未观测到的误差之间的相关。然而,如果我们有不只一个的工具变量,我们就能有效地检验它们中的一部分是否与结构误差不相关。
作为一个例子,在有另外两个工具变量z3和z4的条件下,重新考虑方程(15.49)。我们知道仅用z3作
????y???z???z。?1?y?1??为y2的IV,就能估计(15.49)。给定IV估计值,我们就能计算残差u0122132?1在样本中是否相关。如果它们相关,z4不是y2的有效因为z4在估计中根本没用到,我们可以验证z4与uIV。当然,这并没有告诉我们z3与u1是否相关;实际上,因为它是个有用的检验,我们必须假定z3与u1不相关。然而,如果z3和z4是用相同的逻辑来选择的——例如母亲的教育和父亲的教育——发现z4与u1相关将使人对用z3作为IV产生怀疑。
因为z3和z4的角色可以交换,若是假定z4与u1不相关,我们也可以检验z3与u1是否相关。我们该用哪个检验呢?结果是,我们对检验的选择是无关紧要的。我们必须假定至少有一个IV是外生的。然后,我们可以对2SLS中所用的过度识别约束(overidentifying restrictions)进行检验。根据我们的用意,过度识别约束的数目简单地就是额外的工具变量的数目。假定我们只有一个内生解释变量。如果我们只有y2的单一个IV,而没有过度识别约束,也就没什么可检验的。如果我们有y2的两个IV,如同前面的例子中那样,则我们有一个过度识别约束。如果我们有三个IV,则有两个过度识别约束,等等。
检验过度识别约束是相当简单的。我们必须获得2SLS残差,然后做一个辅助回归。
检验(任意多个)过度识别约束
?1。 (i)用2SLS估计结构方程,获得2SLS残差u?1对所有外生变量回归,获得R,即R1。 (ii)将u(iii)在所有IV都与u1不相关的虚拟假设下,nR~?q,其中q是模型之外的工具变量的数目减去内生解释变量的总数目。如果nR1超过了?q分布中的(例如)5%临界值,我们拒绝H0,并推断出至少部
21
22221a22分的IV不是外生的。
例15.8 职业女性的教育回报
当我们在(15.40)中用用 motheduc和fatheduc作为educ的 IV,我们有一个的过度识别约束。将2SLS残差u1对exper、exper
?2、motheduc和fatheduc做回归,得出R1?.0009。因此,
2nR12?428(.0009)?.3852,这在?12分布中是一个非常小的值(p值 = .535)。因此,父母亲的教育变量
通过了过度识别检验。当我们将丈夫的教育增添到IV表中,我们得到两个过度识别约束,nR1?1.11(p值 = .574)。因此,将huseduc增添到IV表中似乎是合理的,因为它减少了2SLS估计值的标准误:运用所有三个工具,得出的educ的2SLS估计值为.080(se = .022),这使得educ比不用huseduc作为IV时(?educ=.061,se = .031)显著得多。
在前面的例子中,我们提到了关于2SLS的一个普遍事实:在标准的2SLS假定下,在表中增添变量提高了2SLS的渐近有效性。可是要求任何新的工具实际上是外生的——否则,2SLS将甚至不是一致性的——而且这只是个渐近的结果。在具备有典型样本容量可供使用的条件下,增添过多的工具——即增加过度识别约束的数目——会导致2SLS中的严重偏误。详细的讨论将使我们大大偏离正题。Bound、Jaeger和Baker(1995)给出了一个好的例子,他们认为Angrist和Krueger(1991)用许多工具变量获得的教育回报的2SLS估计值,很可能是严重有偏的(即使有成百上千的观测值!)。
无论何时我们有多于所需的工具,都可以用过度识别检验。如果我们有恰好足够的工具,该模型称为是恰好识别的,第(ii)部分中的R将恒等于零。正如我们前面提到的,在恰好识别情况下我们不能检验工具的外生性。
可以使检验成为对任意形式的异方差性强健的t检验。关于细节,参见Wooldridge(1999,第五章)。
22?15.6 异方差性条件下的2SLS
2SLS中的异方差性提出了本质上与OLS情况下相同的问题。最重要的是有可能对任意和未知形式的异方差性获得(渐近)强健的的标准误和检验统计量。一些软件包按常规做此检验。
?表示我们也能用类似布劳殊—培干检验的方法来检验异方差性,对此我们在第8章中讨论过了。令u2SLS残差,并且令z1, z2, …, zm表示所有的解释变量(包括那些用作内生解释变量的IV)。那么,在合
?对理的假定下,[例如,在Wooldridge(1999,第5章)中已有详细的说明],一个渐进有效的统计量是在uz1, z2, …, zm的回归中用于检验联合显著性的通常的F统计量。如果诸zj是联合显著的,同方差性的虚
拟假设就被拒绝。
如果我们将它应用于例15.8中,用motheduc、 fatheduc和huseduc作为educ的工具,我们得到F5,422 = 2.53,p值 = .029。这是在5%水平上异方差性的证据。我们也许想要算出这个对异方差性强健的标准误
22
2来说明这一点。
如果我们知道误差的方差是如何依赖于外生变量的,我们就可以用加权的2SLS方法,它本质上与第8.4节中是一样的。在估计出Var(uz1, z2, ..., zm)的一个模型之后,我们将第i次观测的因变量、解释变量
? ,其中h?;参见?表示估计的方差。和所有工具变量除以h(常数既是解释变量又是IV,将它除以hiii第8.4节。)这样,我们用变换了的工具在变换了的方程中应用2SLS。
15.7 2SLS应用于时间序列方程
当我们将2SLS应用于时间序列数据时,在第10、11和12章中对OLS所作的许多考虑都是适用的。写出每个时期的结构方程为:
yt??0??1xt1?...??kxtk?ut, (15.52) 其中也许一个或多个解释变量xtj与ut相关。用zt1, …, ztm表示一组外生变量:
E(ut)?0, Cov(ztj,ut)?0, j?1, ..., m.
任何一个外生解释变量都同时是一个ztj。为了识别,m?k是必需的(我们至少有与解释变量一样多的外生变量)。
对时间序列或横截面数据,2SLS的作用是完全相同的,只是对于时间序列数据,2SLS的统计性质依赖于基本序列的趋势性的和相关的性质而已。特别是,如果我们有趋势性的因变量或解释变量,我们必须小心地把趋势包括进来。.由于时间趋势是外生的,它总是可以作为自身的工具变量来用。如果运用了月份或季度数据,季节虚拟变量同样可作为工具。
具有强持续性的序列(有单位根)必须谨慎使用,正像OLS的情况那样。往往,在估计之前要对方程进行差分,包括对工具变量进行差分。
在类似第11章中OLS渐近性质的假定下,运用时间序列数据的2SLS是一致性的,且渐近地服从正态分布。实际上,如果我们在表述假定时用工具变量代替解释变量,我们只需要对2SLS增添识别假定。例如,同方差性的假定可表述为:
E(utzt1, ..., ztm)??, (15.53)无序列相关的假定可表述为:
E(utuszt, zs)?0, 对所有t?s, (15.54) 其中zt表示时间t的所有外生变量。关于假定的详尽表述在本章附录中给出。我们将在第16章中为时间序列问题提供2SLS的例子;并参见问题15.5。 问题15.4 检验政府支出增长对产出增长的影响的一个模型是: gGDPt??0??1gGOVt??2INVRATt??3gLABt?ut. 其中g表示增长,GDP是实际国内生产总值,GOV是实际政府支出,INVRAT是国内投资总额对 GDP的比率,LAB是劳动力的多少。[参见Ram(1986)中的方程(6)。]表示t ? 1年的总统是否是 22共和党人的一个虚拟变量,在什么假定下可以是gGOVt的适宜的IV? 23 如同在OLS的情况下那样,时间序列数据往往违背了无序列相关的假定。幸运的是,检验AR(1)序列相关是十分简单的。如果我们写出ut??ut?1?et,并将之代入方程(15.52),我们得到:
yt??0??1xt1?...??kxtk??ut?1?et,t?2. (15.55)
?t?1代替ut?1。此外,如果xtj在(15.52)中是内生的,那么它为检验H0:?1?0,我们必须用2SLS残差u?t?1可用作它在(15.55)中也是内生的,所以我们仍需要运用一个IV。因为et与ut的所有过去值不相关,u自身的工具。
在2SLS之后检验AR(1)序列相关
?t。 (i)用2SLS估计(15.52),获得2SLS残差u(ii)用2SLS估计
?t?1?errort, t?2, ..., n yt??0??1xt1? ... ??kxtk??u?的t统计量检验H0:??0。 ?t?1之外运用了与第(i)部分中相同的工具。用?其中除u如同在第12章中得出的OLS形式的该检验那样,t统计量仅具有渐近的正确性,但实际中它往往会很
适用。可用对异方差性强健的形式来防止异方差性。此外,还可把滞后残差增添到方程中,以便运用一个联合的F检验来对序列相关的高阶形式进行检验。
如果我们侦察出序列相关会怎么样?一些计量经济学软件包将计算标准误,它们对形式相当一般的序列相关和异方差性是强健的。如果由你的计量经济学软件包做此计算,这是一个妥当而简单的方法。其计算与第12.5节中OLS的那些非常相似。参见Wooldridge(1995)中的公式和其他计算公式。
另一个选择是运用AR(1)模型,纠正序列相关。程序与OLS的相似,对工具变量提供另外的约束。准差分方程与方程(12.32)中的相同:
yt??0(1??)??1~xt1?...??k~xtk?et,t?2, (15.56) ~ xtj?xtj??xt?1j。其中~(正如在第12.3节中,我们可以使用t = 1时的观测值,但为了简单我们在此略去了。)ztj?ztj??zt?1j似乎是自然的。问题是:我们能用什么作为工具变量呢?运用准差分工具~然而,只有(15.52)
中的原误差ut在时间t、t ?1和t +1与工具不相关,这才是可行的。那就是说,工具变量在(15.52)中必须是严格外生的。例如,这排除了滞后因变量作为IV的可能性。它也排除了这样的情况:IV中将来的变动反映了误差ut中现在和过去的变化。
带有AR(1)误差的2SLS
?t,t = 1, 2, …, n. (i)用2SLS估计(15.52),获得2SLS残差u?xt?1j和?yt?1,~?,构造准差分变量~?t对u?t?1(t = 2, …, n.)的回归中获得?xtj?xtj??yt?yt??(ii)从u 24
共分享92篇相关文档