双重差分(DID)
DID因果推断

46_CS 估计量--基础组件估计

作者:计量科研导航站发布:2026-04-14★★★

CS 估计量:基础组件估计

Callaway & Sant'Anna (2021) 提出了一种全新的渐进 DID 估计框架,通过"小组-时间"平均处理效应作为基础组件,避免了 TWFE 的负权重偏误。


一、CS 统计量的核心思想

论文摘要要点

Callaway & Sant'Anna (2021, Journal of Econometrics) 提出了:

  1. 识别策略:在渐进 DID 设定下,即使存在非平行的结果动态,仍可识别因果效应参数
  2. 估计方法:支持结果回归、逆概率加权、双重稳健估计
  3. 聚合方案:多种聚合方式以展示异质性和汇总效应
  4. 推断方法:便捷的 Bootstrap 程序用于同时推断

与 TWFE 的根本区别

TWFE CS
一步回归估计单一系数 两步法:先估计基础组件,再聚合
混入"坏控制组"比较 仅使用有效对照(从未处理/尚未处理)
单一处理效应假设 允许完全异质的处理效应

二、核心概念:ATT(g, t)

定义

ATT(g,t)=E[Yt(1)Yt(0)Gg=1]ATT(g, t) = E[Y_t(1) - Y_t(0) \mid G_g = 1]

其中:

  • gg:首次接受处理的时间(组别)
  • tt:结果观测时期
  • Gg=1G_g = 1:在时期 gg 首次接受处理的个体

直觉

ATT(g,t)ATT(g, t) 衡量的是gg 时接受处理的群体时期 tt 的平均处理效应。

例如:ATT(2020,2022)ATT(2020, 2022) 表示 2020 年加入试点的城市在 2022 年的政策效果。

对照组的选取

CS 使用两类有效对照组:

  1. 从未处理组:始终未接受处理的个体
  2. 尚未处理组:在时期 tt 尚未接受处理的个体

关键:绝不使用"已处理组"作为对照组,从根本上避免了坏控制组问题。


三、估计思路

三步法

  1. 估计 ATT(g, t):对每个处理组 gg 和时期 tt 分别估计
  2. 聚合效应:根据研究目的选择合适的聚合方式
    • 相同政策处理时长的组效应加总
    • 同一组不同时点的处理效应加总
    • 同一日历时间的累积效应
  3. Bootstrap 推断:使用 Bootstrap 计算标准误和置信区间

估计方法

CS 提供四种估计方法:

方法 特点
逆概率加权 (IPW) 使用倾向得分加权
结果回归 (OR) 建立对照组的结果模型
双重稳健 (DR) IPW + OR,任一模型正确即可
交互加权 (IW) 基于交互项的回归

四、CS 估计量的优势

理论优势

  1. 无负权重:仅使用有效对照,避免了坏控制组
  2. 完全异质:允许处理效应在组间和时点间完全异质
  3. 灵活聚合:可根据研究目的选择不同的聚合方式
  4. 双重稳健:DR 估计量在倾向得分或结果模型之一正确时一致

实践优势

  1. 软件成熟:R 包 did 和 Stata 命令 csdid 已成熟
  2. 诊断工具:提供平行趋势检验、异质性分析等
  3. 可视化:动态效应图、组别效应图等

核心要点

  1. CS 估计量通过 ATT(g, t) 作为基础组件,避免了 TWFE 的负权重偏误
  2. 对照组仅使用从未处理组尚未处理组
  3. 估计分两步:基础组件估计聚合
  4. 支持四种估计方法,推荐双重稳健方法