双重差分(DID)
DID因果推断
43_Bacon分解-负权重的理解
作者:计量科研导航站发布:2026-04-14★★★
Bacon 分解:负权重的理解
Goodman-Bacon (2021) 证明 TWFE 估计量是所有 2×2 DID 的加权平均。当处理效应异质时,某些比较会产生负权重,导致估计偏误。本文通过数据算例深入理解负权重的来源。
一、数据算例设定
实验设计
3 个个体(A、B、C),每个个体有三期数据(0、1、2):
- :个体固定效应
- :时期固定效应
- :处理状态虚拟变量
处理时间
| 个体 | 处理时间 | 角色 |
|---|---|---|
| B、C | 第 1 期 | 早处理组 |
| A | 第 2 期 | 晚处理组 |
两种情形
- 同质处理效应():处理效应在所有个体和时期相同
- 异质处理效应():处理效应因个体和时期而异
二、控制组的构造
以 A 为处理组
个体 A 在第 2 期接受处理,需要构造控制组:
- B 和 C 在第 1 期已接受处理
- B 和 C 在数据中出现次数相同
- 因此控制组 =
2×2 DID 计算
三、负权重的来源
核心问题
当较早接受处理的个体(B、C)被用作控制组时:
- 如果处理效应随时间递增,B 和 C 在后期已经受到处理影响
- 控制组的"前后差"包含了处理效应
- 这导致 DID 估计量低估真实效应
异质效应下的偏差
| 比较类型 | 权重符号 | 问题 |
|---|---|---|
| A vs. B/C(A 为处理组) | 正 | 标准 DID |
| B/C vs. A(B/C 为处理组,A 后期为控制组) | 负 | A 后期已受处理,控制组被"污染" |
直观理解
当 TWFE 将"晚处理 vs. 早处理"的比较混入估计时:
- 早处理组的结果在后期已经包含了处理效应
- 这相当于用一个"已被处理"的组作为控制组
- 权重为负意味着这种比较抵消了其他比较的贡献
四、结论
核心洞察
- 负权重源于异质性处理效应:如果处理效应恒定,所有 2×2 DID 估计相同,负权重不造成偏误
- 负权重导致符号错误:在极端情况下,负权重的偏误可能超过真实效应
- 早处理组作为控制组是问题根源:他们后期结果已被处理"污染"
应对策略
- 使用 CS/SA/BJS 等新估计量,避免"坏控制组"
- 仅保留"处理 vs. 从未处理"的比较
- 用 Bacon 分解诊断负权重的严重程度
核心要点
- 负权重出现在早处理组后期被用作控制组的比较中
- 当处理效应异质时,负权重导致 TWFE 估计偏误
- 数据算例直观展示了负权重如何抵消真实效应
- Bacon 分解是识别和量化负权重的标准工具