标准 DID 与双向固定效应(TWFE)
系统理解经典双重差分法的模型设定、估计方法与推断逻辑。
一、DID 的因果效应定义
研究设定
考虑一个 2×2 的设计:
- 两组:处理组(Di=1)和控制组(Di=0)
- 两期:处理前(t=0)和处理后(t=1)
潜在结果框架下的因果效应:
τATT=E[Y1(1)−Y1(0)∣D=1]
其中:
- Y1(1):处理组在处理后接受处理的潜在结果
- Y1(0):处理组在处理后未接受处理的潜在结果
识别问题
我们无法直接观测 Y1(0)(处理组在未处理状态下的结果),因此需要通过控制组来"替代"。
二、平行趋势假设
核心假设
E[Y1(0)−Y0(0)∣D=1]=E[Y1(0)−Y0(0)∣D=0]
即:在没有处理的情况下,处理组和控制组的结果变量具有相同的时间趋势。
识别推导
在平行趋势假设下:
τATT=E[Y1(1)−Y1(0)∣D=1]=E[Y1(1)−Y0(1)∣D=1]−平行趋势E[Y1(0)−Y0(0)∣D=1]=E[Y1(1)−Y0(1)∣D=1]−E[Y1(0)−Y0(0)∣D=0]=处理组前后差{E[Y1∣D=1]−E[Y0∣D=1]}−控制组前后差{E[Y1∣D=0]−E[Y0∣D=0]}
这就是"双重差分"的来源。
三、回归估计方法
方法一:交互项回归
Yit=α+β1Treati+β2Postt+τ(Treati×Postt)+εit
DID 估计量即为交互项系数 τ^。
方法二:双向固定效应(TWFE)
Yit=αi+λt+τDit+εit
其中:
- αi:个体固定效应,控制不随时间变化的个体特征
- λt:时间固定效应,控制不随个体变化的时间趋势
- Dit=Treati×Postt:处理变量
在 2×2 设计下,TWFE 与交互项回归等价。
Stata 实现
// 方法一:交互项回归
reg y i.treat##i.post, robust
// 方法二:TWFE(推荐)
reghdfe y treat#post, absorb(id year) cluster(id)
四、标准误与推断
聚类标准误
面板数据中,同一观测单位在不同时期的误差项可能存在序列相关。需要使用聚类标准误(Clustered Standard Errors)。
一般规则:在处理变量变化的层级聚类(通常是个体或地区层级)。
Bertrand, Duflo & Mullainathan (2004) 的警示
- 不聚类或聚类层级过低会导致标准误严重低估
- 在州级政策研究中,应在州层级聚类
- 时间序列较短时,应考虑使用更稳健的推断方法(如 wild bootstrap)
五、经典案例:Card & Krueger (1994)
|
新泽西(处理) |
宾夕法尼亚(控制) |
差分 |
| 政策前 |
20.44 |
23.33 |
-2.89 |
| 政策后 |
21.03 |
21.17 |
-0.14 |
| 前后差 |
+0.59 |
-2.16 |
+2.76 |
DID 估计:τ^=2.76(最低工资提高反而增加了就业)
常见错误
- 忘记聚类标准误:面板 DID 必须聚类,否则标准误严重低估
- 聚类层级错误:应在处理变量变化的层级聚类
- 混淆固定效应和 DID:加入个体和时间固定效应不等于 DID,还需要正确定义处理变量
- 未检验平行趋势:平行趋势是 DID 的核心假设,不可跳过
参考文献
- Card, D., & Krueger, A. B. (1994). Minimum Wages and Employment. AER, 84(4), 772-793.
- Angrist, J. D., & Pischke, J. S. (2009). Mostly Harmless Econometrics. Princeton.
- Bertrand, M., Duflo, E., & Mullainathan, S. (2004). How Much Should We Trust Differences-in-Differences Estimates? QJE, 119(1), 249-275.