双重差分(DID)
DID因果推断

43_Bacon分解-负权重的理解

作者:计量科研导航站发布:2026-04-14★★★

Bacon 分解:负权重的理解

Goodman-Bacon (2021) 证明 TWFE 估计量是所有 2×2 DID 的加权平均。当处理效应异质时,某些比较会产生负权重,导致估计偏误。本文通过数据算例深入理解负权重的来源。


一、数据算例设定

实验设计

3 个个体(A、B、C),每个个体有三期数据(0、1、2):

  • αi\alpha_i:个体固定效应
  • λt\lambda_t:时期固定效应
  • DitD_{it}:处理状态虚拟变量

处理时间

个体 处理时间 角色
B、C 第 1 期 早处理组
A 第 2 期 晚处理组

两种情形

  1. 同质处理效应Δ1\Delta_1):处理效应在所有个体和时期相同
  2. 异质处理效应Δ2\Delta_2):处理效应因个体和时期而异

二、控制组的构造

以 A 为处理组

个体 A 在第 2 期接受处理,需要构造控制组:

  • B 和 C 在第 1 期已接受处理
  • B 和 C 在数据中出现次数相同
  • 因此控制组 = 12B+12C\frac{1}{2}B + \frac{1}{2}C

2×2 DID 计算

DIDA=(YA,2YA,1)[12(YB,2YB,0)+12(YC,2YC,0)]\text{DID}_A = (Y_{A,2} - Y_{A,1}) - \left[\frac{1}{2}(Y_{B,2} - Y_{B,0}) + \frac{1}{2}(Y_{C,2} - Y_{C,0})\right]


三、负权重的来源

核心问题

当较早接受处理的个体(B、C)被用作控制组时:

  • 如果处理效应随时间递增,B 和 C 在后期已经受到处理影响
  • 控制组的"前后差"包含了处理效应
  • 这导致 DID 估计量低估真实效应

异质效应下的偏差

比较类型 权重符号 问题
A vs. B/C(A 为处理组) 标准 DID
B/C vs. A(B/C 为处理组,A 后期为控制组) A 后期已受处理,控制组被"污染"

直观理解

当 TWFE 将"晚处理 vs. 早处理"的比较混入估计时:

  • 早处理组的结果在后期已经包含了处理效应
  • 这相当于用一个"已被处理"的组作为控制组
  • 权重为负意味着这种比较抵消了其他比较的贡献

四、结论

核心洞察

  1. 负权重源于异质性处理效应:如果处理效应恒定,所有 2×2 DID 估计相同,负权重不造成偏误
  2. 负权重导致符号错误:在极端情况下,负权重的偏误可能超过真实效应
  3. 早处理组作为控制组是问题根源:他们后期结果已被处理"污染"

应对策略

  • 使用 CS/SA/BJS 等新估计量,避免"坏控制组"
  • 仅保留"处理 vs. 从未处理"的比较
  • 用 Bacon 分解诊断负权重的严重程度

核心要点

  1. 负权重出现在早处理组后期被用作控制组的比较中
  2. 当处理效应异质时,负权重导致 TWFE 估计偏误
  3. 数据算例直观展示了负权重如何抵消真实效应
  4. Bacon 分解是识别和量化负权重的标准工具