双重差分(DID)
DID因果推断
51_模糊DID的基本思想以及Wald-DID
作者:计量科研导航站发布:2026-04-14★★★
模糊 DID 的基本思想与 Wald-DID
标准 DID 要求"处理组全处理、控制组全不处理"(Sharp DID)。然而在许多现实场景中,处理是模糊的:处理组中只有部分个体接受了处理,控制组中也可能有部分个体接受了处理。
一、模糊 DID 的应用场景
什么是模糊设计?
在两个时间点之间,某些组中受处理单元的比例增长比其他组更快,但:
- 没有任何组"全处理"或"全不处理"
- 处理率的变化是渐进的,而非跳跃的
典型案例
案例 1:农业技术推广
某国在 2015–2020 年间推广节水灌溉技术:
| 省份 | 2015 年采用率 | 2020 年采用率 | 变化 |
|---|---|---|---|
| A 省 | 10% | 60% | +50pp |
| B 省 | 8% | 25% | +17pp |
| C 省 | 5% | 15% | +10pp |
案例 2:在线教育普及
疫情后各地区高质量在线教学覆盖率增长不均:
| 地区 | 疫情前覆盖率 | 疫情后覆盖率 | 变化 |
|---|---|---|---|
| 一线城市 | 30% | 85% | +55pp |
| 二线城市 | 25% | 60% | +35pp |
| 农村地区 | 10% | 30% | +20pp |
二、模糊干预的常见情形
1. 自愿参加的公共项目
政府提供激励但不强制参加,最终是否参加取决于个人选择。
案例:职业培训计划。A 城市所有失业者都被"覆盖",但只有一部分人真正去上课。
2. 地理渗透(Geographic Leakage)
政策基于地理边界划分,但资源或人群可以在边界流动。
案例:消费券发放。相邻省份居民可能通过借用亲戚账号在对照组领到券。
3. 行政自由裁量权
政策有明确门槛,但实际操作中存在"关系户"或"行政通融"。
案例:低保补贴。村委会审核时有自由裁量权,导致"名义符合者"和"实际获得者"不完全重合。
三、为什么不能用标准 DID?
Sharp DID 的假设
- 处理组在政策后全部接受处理
- 控制组在政策后全部未接受处理
- 处理状态 是外生的
模糊场景的问题
- 是内生的:有人该处理却没处理,有人不该处理却处理了
- 传统 DID 测量的是"被政策命中"的影响,而非"真正接受干预"的影响
- 由于有一部分人没有响应,DID 系数会被稀释
四、Wald-DID 估计量
定义
其中:
- 分子:结果的 DID
- 分母:处理率的 DID
直觉
Wald-DID 本质上是两个 DID 系数相除:
- 分子:处理组比控制组结果多变化了多少
- 分母:处理组比控制组处理率多变化了多少
处理组与控制组的划分
| 概念 | 定义 |
|---|---|
| 处理组(Treatment Group) | 处理率增幅更大的组 |
| 控制组(Control Group) | 处理率增幅更小或稳定的组 |
重要区分:
- "Treatment Group" 是一个地区/群体集合,包含很多 units
- 其中有的 units 被处理(treated),有的未被处理(untreated)
- 表示处理组在时期 1 的处理率
2SLS 解释
模糊 DID 的估计实际上是以 Treat(是否属于处理组)作为工具变量的 2SLS 估计:
由于 在预测 时存在内生性,以 Treat 作为 IV 进行 2SLS 回归。
五、Wald-DID 的局限性
de Chaisemartin & d'Haultfoeuille (2018) 证明:
Wald-DID 仅在以下假设下识别 LATE:
- 处理效应跨期稳定:处理效应在时期 0 和时期 1 相同
- 处理效应在组间同质:处理组和控制组的处理效应相同
当这些假设不满足时,Wald-DID 会产生显著偏误。
核心要点
- 模糊 DID 适用于处理率渐进变化而非跳跃变化的场景
- Wald-DID 是结果 DID / 处理率 DID 的比值
- Wald-DID 等价于以 Treat 为 IV 的 2SLS 估计
- Wald-DID 仅在处理效应跨期稳定且组间同质时识别 LATE
- de Chaisemartin & d'Haultfoeuille (2018) 提出了替代估计量 WTC