数据范儿_范老师-AI时代科研统计新范式-计量科研AI导航

模糊 DID 的基本思想与 Wald-DID

标准 DID 要求"处理组全处理、控制组全不处理"（Sharp DID）。然而在许多现实场景中，处理是模糊的：处理组中只有部分个体接受了处理，控制组中也可能有部分个体接受了处理。

一、模糊 DID 的应用场景

什么是模糊设计？

在两个时间点之间，某些组中受处理单元的比例增长比其他组更快，但：

没有任何组"全处理"或"全不处理"
处理率的变化是渐进的，而非跳跃的

典型案例

案例 1：农业技术推广

某国在 2015–2020 年间推广节水灌溉技术：

省份	2015 年采用率	2020 年采用率	变化
A 省	10%	60%	+50pp
B 省	8%	25%	+17pp
C 省	5%	15%	+10pp

案例 2：在线教育普及

疫情后各地区高质量在线教学覆盖率增长不均：

地区	疫情前覆盖率	疫情后覆盖率	变化
一线城市	30%	85%	+55pp
二线城市	25%	60%	+35pp
农村地区	10%	30%	+20pp

二、模糊干预的常见情形

1. 自愿参加的公共项目

政府提供激励但不强制参加，最终是否参加取决于个人选择。

案例：职业培训计划。A 城市所有失业者都被"覆盖"，但只有一部分人真正去上课。

2. 地理渗透（Geographic Leakage）

政策基于地理边界划分，但资源或人群可以在边界流动。

案例：消费券发放。相邻省份居民可能通过借用亲戚账号在对照组领到券。

3. 行政自由裁量权

政策有明确门槛，但实际操作中存在"关系户"或"行政通融"。

案例：低保补贴。村委会审核时有自由裁量权，导致"名义符合者"和"实际获得者"不完全重合。

三、为什么不能用标准 DID？

Sharp DID 的假设

处理组在政策后全部接受处理
控制组在政策后全部未接受处理
处理状态 $D_{it}$ 是外生的

模糊场景的问题

$D_{it}$ 是内生的：有人该处理却没处理，有人不该处理却处理了
传统 DID 测量的是"被政策命中"的影响，而非"真正接受干预"的影响
由于有一部分人没有响应，DID 系数会被稀释

四、Wald-DID 估计量

定义

$\text{Wald-DID} = \frac{\text{DID}(Y)}{\text{DID}(D)} = \frac{(Y_{11} - Y_{10}) - (Y_{01} - Y_{00})}{(D_{11} - D_{10}) - (D_{01} - D_{00})}$

其中：

分子：结果的 DID
分母：处理率的 DID

直觉

Wald-DID 本质上是两个 DID 系数相除：

分子：处理组比控制组结果多变化了多少
分母：处理组比控制组处理率多变化了多少

处理组与控制组的划分

概念	定义
处理组（Treatment Group）	处理率增幅更大的组
控制组（Control Group）	处理率增幅更小或稳定的组

重要区分：

"Treatment Group" 是一个地区/群体集合，包含很多 units
其中有的 units 被处理（treated），有的未被处理（untreated）
$E[D_{11}]$ 表示处理组在时期 1 的处理率

2SLS 解释

模糊 DID 的估计实际上是以 Treat（是否属于处理组）作为工具变量的 2SLS 估计：

$Y_{it} = \alpha + \beta D_{it} + \gamma \text{Treat}_i + \delta \text{Post}_t + \varepsilon_{it}$

由于 $D_{it}$ 在预测 $Y$ 时存在内生性，以 Treat 作为 IV 进行 2SLS 回归。

五、Wald-DID 的局限性

de Chaisemartin & d'Haultfoeuille (2018) 证明：

Wald-DID 仅在以下假设下识别 LATE：

处理效应跨期稳定：处理效应在时期 0 和时期 1 相同
处理效应在组间同质：处理组和控制组的处理效应相同

当这些假设不满足时，Wald-DID 会产生显著偏误。

核心要点

模糊 DID 适用于处理率渐进变化而非跳跃变化的场景
Wald-DID 是结果 DID / 处理率 DID 的比值
Wald-DID 等价于以 Treat 为 IV 的 2SLS 估计
Wald-DID 仅在处理效应跨期稳定且组间同质时识别 LATE
de Chaisemartin & d'Haultfoeuille (2018) 提出了替代估计量 WTC