双重差分(DID)
DID因果推断

12_标准 did 与 TWFE

作者:计量科研导航站发布:2026-04-14★★★

标准 DID 与双向固定效应(TWFE)

系统理解经典双重差分法的模型设定、估计方法与推断逻辑。


一、DID 的因果效应定义

研究设定

考虑一个 2×2 的设计:

  • 两组:处理组(Di=1D_i = 1)和控制组(Di=0D_i = 0
  • 两期:处理前(t=0t = 0)和处理后(t=1t = 1

潜在结果框架下的因果效应: τATT=E[Y1(1)Y1(0)D=1]\tau_{ATT} = E[Y_1(1) - Y_1(0) \mid D = 1]

其中:

  • Y1(1)Y_1(1):处理组在处理后接受处理的潜在结果
  • Y1(0)Y_1(0):处理组在处理后未接受处理的潜在结果

识别问题

我们无法直接观测 Y1(0)Y_1(0)(处理组在未处理状态下的结果),因此需要通过控制组来"替代"。


二、平行趋势假设

核心假设

E[Y1(0)Y0(0)D=1]=E[Y1(0)Y0(0)D=0]E[Y_1(0) - Y_0(0) \mid D = 1] = E[Y_1(0) - Y_0(0) \mid D = 0]

即:在没有处理的情况下,处理组和控制组的结果变量具有相同的时间趋势。

识别推导

在平行趋势假设下:

τATT=E[Y1(1)Y1(0)D=1]=E[Y1(1)Y0(1)D=1]E[Y1(0)Y0(0)D=1]平行趋势=E[Y1(1)Y0(1)D=1]E[Y1(0)Y0(0)D=0]={E[Y1D=1]E[Y0D=1]}处理组前后差{E[Y1D=0]E[Y0D=0]}控制组前后差\begin{aligned} \tau_{ATT} &= E[Y_1(1) - Y_1(0) \mid D = 1] \\ &= E[Y_1(1) - Y_0(1) \mid D = 1] - \underbrace{E[Y_1(0) - Y_0(0) \mid D = 1]}_{\text{平行趋势}} \\ &= E[Y_1(1) - Y_0(1) \mid D = 1] - E[Y_1(0) - Y_0(0) \mid D = 0] \\ &= \underbrace{\{E[Y_1 \mid D=1] - E[Y_0 \mid D=1]\}}_{\text{处理组前后差}} - \underbrace{\{E[Y_1 \mid D=0] - E[Y_0 \mid D=0]\}}_{\text{控制组前后差}} \end{aligned}

这就是"双重差分"的来源。


三、回归估计方法

方法一:交互项回归

Yit=α+β1Treati+β2Postt+τ(Treati×Postt)+εitY_{it} = \alpha + \beta_1 Treat_i + \beta_2 Post_t + \tau (Treat_i \times Post_t) + \varepsilon_{it}

DID 估计量即为交互项系数 τ^\hat{\tau}

方法二:双向固定效应(TWFE)

Yit=αi+λt+τDit+εitY_{it} = \alpha_i + \lambda_t + \tau D_{it} + \varepsilon_{it}

其中:

  • αi\alpha_i:个体固定效应,控制不随时间变化的个体特征
  • λt\lambda_t:时间固定效应,控制不随个体变化的时间趋势
  • Dit=Treati×PosttD_{it} = Treat_i \times Post_t:处理变量

在 2×2 设计下,TWFE 与交互项回归等价

Stata 实现

// 方法一:交互项回归
reg y i.treat##i.post, robust
 
// 方法二:TWFE(推荐)
reghdfe y treat#post, absorb(id year) cluster(id)

四、标准误与推断

聚类标准误

面板数据中,同一观测单位在不同时期的误差项可能存在序列相关。需要使用聚类标准误(Clustered Standard Errors)。

一般规则:在处理变量变化的层级聚类(通常是个体或地区层级)。

Bertrand, Duflo & Mullainathan (2004) 的警示

  • 不聚类或聚类层级过低会导致标准误严重低估
  • 在州级政策研究中,应在层级聚类
  • 时间序列较短时,应考虑使用更稳健的推断方法(如 wild bootstrap)

五、经典案例:Card & Krueger (1994)

新泽西(处理) 宾夕法尼亚(控制) 差分
政策前 20.44 23.33 -2.89
政策后 21.03 21.17 -0.14
前后差 +0.59 -2.16 +2.76

DID 估计:τ^=2.76\hat{\tau} = 2.76(最低工资提高反而增加了就业)


常见错误

  1. 忘记聚类标准误:面板 DID 必须聚类,否则标准误严重低估
  2. 聚类层级错误:应在处理变量变化的层级聚类
  3. 混淆固定效应和 DID:加入个体和时间固定效应不等于 DID,还需要正确定义处理变量
  4. 未检验平行趋势:平行趋势是 DID 的核心假设,不可跳过

参考文献

  • Card, D., & Krueger, A. B. (1994). Minimum Wages and Employment. AER, 84(4), 772-793.
  • Angrist, J. D., & Pischke, J. S. (2009). Mostly Harmless Econometrics. Princeton.
  • Bertrand, M., Duflo, E., & Mullainathan, S. (2004). How Much Should We Trust Differences-in-Differences Estimates? QJE, 119(1), 249-275.