双重差分(DID)
DID因果推断

17_DID中的控制变量

作者:计量科研导航站发布:2026-04-14★★★

DID 中的控制变量:加还是不加?

在 DID 回归中是否应该加入控制变量,是一个经常引起争议的问题。


两种观点

观点一:不需要控制变量

  • DID 的核心识别来自前后差异的比较,而非横截面差异
  • 个体固定效应已经控制了所有不随时间变化的特征
  • 时间固定效应控制了所有不随个体变化的时间趋势
  • 加入控制变量可能引入坏控制(Bad Controls)问题

观点二:需要控制变量

  • 可以提高估计精度(减少残差方差)
  • 可以控制与处理同时发生的其他冲击
  • 可以帮助验证平行趋势假设的合理性

什么情况下应该加控制变量?

应该加

  • 控制变量在处理前就已存在且不受处理影响
  • 控制变量可能与结果变量相关,加入后能提高效率
  • 需要控制与处理同时发生的其他政策冲击

不应该加

  • 控制变量本身是处理的结果(坏控制)
  • 控制变量与处理变量高度相关(共线性)
  • 没有明确的理论依据说明需要控制

坏控制问题

坏控制(Bad Controls)是指那些本身受到处理影响的变量。将其加入回归会"控制掉"一部分处理效应,导致估计偏误。

:研究教育对收入的影响时,加入"职业类型"作为控制变量是坏控制,因为教育可能通过影响职业选择来影响收入。


核心要点

  1. DID 的核心识别不依赖控制变量,但控制变量可以提高效率
  2. 只加入处理前就已确定的控制变量,避免坏控制
  3. 加入控制变量应有明确的理论依据
  4. 汇报结果时应同时报告有无控制变量的估计结果