双重差分(DID)
DID因果推断
46_CS 估计量--基础组件估计
作者:计量科研导航站发布:2026-04-14★★★
CS 估计量:基础组件估计
Callaway & Sant'Anna (2021) 提出了一种全新的渐进 DID 估计框架,通过"小组-时间"平均处理效应作为基础组件,避免了 TWFE 的负权重偏误。
一、CS 统计量的核心思想
论文摘要要点
Callaway & Sant'Anna (2021, Journal of Econometrics) 提出了:
- 识别策略:在渐进 DID 设定下,即使存在非平行的结果动态,仍可识别因果效应参数
- 估计方法:支持结果回归、逆概率加权、双重稳健估计
- 聚合方案:多种聚合方式以展示异质性和汇总效应
- 推断方法:便捷的 Bootstrap 程序用于同时推断
与 TWFE 的根本区别
| TWFE | CS |
|---|---|
| 一步回归估计单一系数 | 两步法:先估计基础组件,再聚合 |
| 混入"坏控制组"比较 | 仅使用有效对照(从未处理/尚未处理) |
| 单一处理效应假设 | 允许完全异质的处理效应 |
二、核心概念:ATT(g, t)
定义
其中:
- :首次接受处理的时间(组别)
- :结果观测时期
- :在时期 首次接受处理的个体
直觉
衡量的是在 时接受处理的群体在时期 的平均处理效应。
例如: 表示 2020 年加入试点的城市在 2022 年的政策效果。
对照组的选取
CS 使用两类有效对照组:
- 从未处理组:始终未接受处理的个体
- 尚未处理组:在时期 尚未接受处理的个体
关键:绝不使用"已处理组"作为对照组,从根本上避免了坏控制组问题。
三、估计思路
三步法
- 估计 ATT(g, t):对每个处理组 和时期 分别估计
- 聚合效应:根据研究目的选择合适的聚合方式
- 相同政策处理时长的组效应加总
- 同一组不同时点的处理效应加总
- 同一日历时间的累积效应
- Bootstrap 推断:使用 Bootstrap 计算标准误和置信区间
估计方法
CS 提供四种估计方法:
| 方法 | 特点 |
|---|---|
| 逆概率加权 (IPW) | 使用倾向得分加权 |
| 结果回归 (OR) | 建立对照组的结果模型 |
| 双重稳健 (DR) | IPW + OR,任一模型正确即可 |
| 交互加权 (IW) | 基于交互项的回归 |
四、CS 估计量的优势
理论优势
- 无负权重:仅使用有效对照,避免了坏控制组
- 完全异质:允许处理效应在组间和时点间完全异质
- 灵活聚合:可根据研究目的选择不同的聚合方式
- 双重稳健:DR 估计量在倾向得分或结果模型之一正确时一致
实践优势
- 软件成熟:R 包
did和 Stata 命令csdid已成熟 - 诊断工具:提供平行趋势检验、异质性分析等
- 可视化:动态效应图、组别效应图等
核心要点
- CS 估计量通过 ATT(g, t) 作为基础组件,避免了 TWFE 的负权重偏误
- 对照组仅使用从未处理组或尚未处理组
- 估计分两步:基础组件估计 → 聚合
- 支持四种估计方法,推荐双重稳健方法