政策评估中"中介效应"因果分析, 有趣的前沿方法

政策评估中

欢迎投稿(荐稿)计量经济圈,计量相关都行git

邮箱:econometrics666@sina.cnweb

copyrights@计量经济圈因果推断研究小组, 欢迎加入交流学习, 值得青睐的博士研究群体组织。do文件也放在我们的社群。app

政策评估中

感谢各位,一旦成为圈子的一员,但愿咱们就珍惜缘分,互帮互助让彼此都有所进步。框架

政策评估中

今天,咱们因果推断研究小组给圈友引荐一下“政策评估中中介效应的因果分析(causal mediation analysis)”。ide

在通常的政策评估框架下,咱们只须要两个主要变量——结果变量和政策处理变量,再加上一些协变量。而后经过反事实的框架来理清政策效应,即经过准实验的方式来从新构建一个对照组和参与组样本。学习

在咱们学习过程当中,常常用到的例子是:参与政府的就业培训项目是否提升了咱们找到工做的机率。由于这个例子里存在着严重的“自选择(self-selection)效应”——可能有更大概率找到工做的个体更愿意参与就业培训项目,由于他们还能够从中获得更多的技能提高。3d

咱们为了推断出一个因果关系,而后经过使用匹配方法去修正样本里隐含的内生性问题。通常地,咱们经过寻找那些会影响“是否参与就业培训”这个决策的pretreatment variables(好比,性别,教育等这些已经改变不了的我的特征变量),来得到一个倾向值,即这我的有多大概率会参与这个就业培训项目。再经过不一样的匹配方式来寻找可以匹配得起来的参与组与对照组,这样就能够获得相对没有那么多混淆因素存在的因果关系。orm

如今,咱们想要研究一下究竟是什么机制致使参与就业培训项目的人更可以找到工做?而根据文献或者直觉判断,咱们认为多是参与就业培训项目会提升人的在找工做中的自信度,从而有了更高的概率去得到工做。因此,这里面的中介变量就是人在找工做过程当中的自信度。blog

咱们须要验证这个假设,那该怎么着手呢?传统地方法是以下方三个方程展现的那样,其中Y是因变量或结果变量,T是政策处理变量(虚拟变量),M是中介变量。咱们依次作一个回归方程,前面两个方程的β1和β2系数都显著,那就须要着重看看第三个方程里β3和γ是否是显著了。若是γ显著,但β3不显著,那意味着M是我们想要寻找到的中介变量;若是γ显著,但β3的系数降低不少,那也意味着M至少部分地成为了T到Y的中介变量。开发

政策评估中

那么,这种三步方程的形式是否是就可以造成一种先后因果的中介效应机制呢?答案是,须要知足几个条件:方程是线性的,处理变量T与中介变量M没有交互效应(下面这个表达形式),知足序列可忽略性(sequential ignorability)。

因此,通常而言这个sgmediation程序是不能用来处理结果变量Y或中介变量M是非连续性的方程。序列可忽略性是什么意思呢?第一,咱们须要保证这个政策处理变量分配是随机的,就是说咱们经过pretreatment variables预测的政策处理效应,须要与结果变量Y和中介变量M是彼此独立的。第二,这个中介变量在上面的最后一个方程中是须要知足外生性假定的,即经过第二式中政策处理变量T和pretreatment variables获得的中介效应M也知足随机性。

政策评估中

若是不知足上面的三个条件,即便咱们开发了针对结果变量Y和中介变量M的logit/probit估计方程,那也不能说这是“中介因果效应”。好比,咱们如今用得比较多的binary_mediation, ldecomp等针对二值虚拟变量的中介效应分析(要么Y,要么M是二值虚拟变量)。

如今,咱们要介绍的这种可以识别中介因果效应的方法,最核心的优点在于他可以提供关于中介变量M是不是具备随机性的敏感性分析。这个敏感性分析可以告诉咱们,一旦上面提到的一些关键性条件再也不成立时,我们的这些估计值会发生怎样的改变。

示例:

clear

*Create simulated data

set seed 312789

set obs 2000

*Draw realizations of error terms and pretreatment covariate x assuming no correlation

matrix m = (0,0,0)

matrix sd = (1,1,1)

drawnorm e1 e2 x, n(`n') means(m) sds(sd)

*Generate realizations of treatment (T), mediator (M), and outcome (Y)variables

generate T = round(runiform(), 1) // 政策处理虚拟变量

generate M = 0.25+0.25T+0.25x+e1 // 中介变量能够连续或二值

generate Y = 0.25 + 0.25T + 0.25M + 0.25*x + e2 // 结果变量能够连续或二指

*中介效应分析,两个方程不能同时为probit

medeff (regress M T x) (regress Y T M x), mediate(M) treat(T) sims(1000) seed(1)

政策评估中
政策评估中

政策评估中

ACME就是中介效应0.067,而这个政策的直接效应为0.297。

gen M1=1 if M>1 //生成一个虚拟变量为后面probit回归使用

replace M1=0 if M<=1

gen Y1=1 if Y>0 // 生成一个虚拟变量为后面probit回归使用

replace Y1=0 if Y<=0

medeff (probit M1 T x) (regress Y T M1 x), mediate(M1) treat(T) sims(1000) // M1是虚拟变量,Y是连续变量

政策评估中

medeff (regress M T x) (probit Y1 T M x), mediate(M) treat(T) sims(1000) // Y1是虚拟变量,M是连续变量

政策评估中

  • 敏感性检验 // 检验我们这个中介变量是否是知足随机性

medsens (regress M T x) (regress Y T M x), treat(T) mediate(M) sims(100)

https://mmbiz.qpic.cn/mmbiz_png/gPuXCNBzgTfkqlBTsa1Pjvevpyic3tK3VtjgficjicXxPiaTW4lpnmecZAm5lQMDgX0hhnA2fYYx5aXhqic3iaibtcxJg/640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=1&wx_co=1

The results show that for the point estimate of the ACME to be zero, the correlation between e2 and e3 must be approximately 0.24.

政策评估中

这个图是平均的因果中介效应与违反序列可忽略性假设的关系图。

能够参看这篇文章,再进行系统学习。须要do文件的,能够前往计量经济圈社群直接领取。

政策评估中