菜鸟科技网

Stata工具变量回归命令该如何正确使用?

Stata工具变量回归命令是解决内生性问题的重要方法,当模型中的解释变量与误差项相关时,普通最小二乘法(OLS)估计量会出现偏误和不一致,而工具变量法(IV)通过引入与内生变量相关但与误差项无关的工具变量,得到一致的参数估计,Stata提供了多种工具变量回归命令,如ivregressivreg2ivreghdfe等,满足不同场景下的分析需求。

Stata工具变量回归命令该如何正确使用?-图1
(图片来源网络,侵删)

核心命令ivregress

ivregress是Stata中最基础的工具变量回归命令,支持多种估计方法,包括两阶段最小二乘法(2SLS)、广义矩估计(GMM)等,其基本语法为:

ivregress depvar [varlist1] (varlist2 = varlist3) [if] [in] [weight], options

depvar为被解释变量,varlist1为外生解释变量,varlist2为内生解释变量,varlist3为工具变量,研究教育对收入的影响,教育年限可能存在内生性(如遗漏能力变量),可使用家庭背景作为工具变量:

ivregress 2sls income experience (education = father_education mother_occupation), vce(robust)

选项vce(robust)使用稳健标准误,small则使用t分布的小样本修正。ivregress默认输出2SLS结果,若使用GMM估计,可添加gmm选项。

增强命令ivreg2

ivreg2(需安装ivreg2包)是ivregress的增强版,提供更多诊断工具和选项,如识别检验、过度检验等,其语法与ivregress类似,但功能更丰富:

Stata工具变量回归命令该如何正确使用?-图2
(图片来源网络,侵删)
ivreg2 depvar [varlist1] (varlist2 = varlist3), options

常用选项包括:

  • first:显示第一阶段回归结果,可检验工具变量的相关性(F统计量需大于10,避免弱工具变量问题)。
  • weak:执行弱工具变量检验(Cragg-Donald Wald F统计量、Kleibergen-Paap rk Wald F统计量)。
  • endog(varlist):进行内生性检验(Hausman检验),p值小于0.05表明存在内生性。
  • robust:使用稳健标准误,cluster(clustvar)则使用聚类稳健标准误。

在上述教育回归中添加诊断:

ivreg2 income experience (education = father_education mother_occupation), first weak robust endog(education)

输出结果中,第一阶段F统计量若大于10,说明工具变量相关性较强;Hausman检验p值显著,则支持使用IV估计。

面板数据工具变量命令ivreghdfe

对于面板数据,若存在个体固定效应和内生性问题,可使用ivreghdfe(需安装ivreghdfe包),其语法为:

Stata工具变量回归命令该如何正确使用?-图3
(图片来源网络,侵删)
ivreghdfe depvar [varlist1] (varlist2 = varlist3), absorb(panelvar) options

absorb(panelvar)用于吸收个体或时间固定效应,分析企业研发投入对生产率的影响,控制企业固定效应:

ivreghdfe productivity ln_labor (rd_intensity = tax_credit), absorb(firm_id) first robust

tax_credit为研发税收抵免,作为研发强度的工具变量。

工具变量选择与检验

工具变量的有效性需满足两个条件:相关性(工具变量与内生变量相关)和外生性(工具变量与误差项无关),Stata可通过以下方法检验:

  1. 相关性检验ivreg2first选项输出第一阶段F统计量,F>10表明工具变量有效。
  2. 外生性检验:若工具变量数量多于内生变量,可进行过度识别检验(Sargan检验或Hansen J检验),p值不拒绝原假设(工具变量外生)。
  3. 弱工具变量检验ivreg2weak选项提供多种统计量,如Cragg-Donald Wald F统计量。

结果解读与注意事项

工具变量回归结果需重点关注:

  • 系数符号与显著性:与OLS对比,若系数方向或显著性变化较大,表明内生性问题可能影响OLS结果。
  • 第一阶段结果:工具变量的系数应显著,F统计量需足够大。
  • 诊断检验:弱工具变量和过度识别检验的p值是判断结果可靠性的关键。

注意事项包括:

  1. 工具变量的外生性无法通过数据直接检验,需依赖经济理论或逻辑推断。
  2. 若存在多个内生变量,需至少相同数量的工具变量,且工具变量需与不同内生变量相关。
  3. 面板数据工具变量需考虑动态面板偏差,可使用xtivreg2xtdpdsys等命令。

相关问答FAQs

Q1: 如何判断工具变量是否为弱工具变量?
A1: 使用ivreg2命令的weak选项,查看Cragg-Donald Wald F统计量或Kleibergen-Paap rk Wald F统计量,通常认为F统计量大于10时,工具变量不是弱工具变量;若F<10,则工具变量较弱,可能导致IV估计偏误较大,需寻找更强的工具变量或使用有限信息最大似然法(LIML)等更稳健的估计方法。

Q2: 工具变量数量多于内生变量时,如何检验工具变量的外生性?
A2: 当工具变量数量(L)大于内生变量数量(K),即过度识别时,可通过Sargan检验( homoskedastic误差下)或Hansen J检验(异方差下)检验工具变量的联合外生性,在ivreg2中,默认输出Hansen J检验,其原假设为“所有工具变量外生”,若p值大于0.05,不能拒绝原假设,表明工具变量外生性假设合理;若p值显著,则可能存在部分工具变量与误差项相关,需重新选择工具变量。

分享:
扫描分享到社交APP
上一篇
下一篇