双重差分(DID)
DID因果推断
17_DID中的控制变量
作者:计量科研导航站发布:2026-04-14★★★
DID 中的控制变量:加还是不加?
在 DID 回归中是否应该加入控制变量,是一个经常引起争议的问题。
两种观点
观点一:不需要控制变量
- DID 的核心识别来自前后差异的比较,而非横截面差异
- 个体固定效应已经控制了所有不随时间变化的特征
- 时间固定效应控制了所有不随个体变化的时间趋势
- 加入控制变量可能引入坏控制(Bad Controls)问题
观点二:需要控制变量
- 可以提高估计精度(减少残差方差)
- 可以控制与处理同时发生的其他冲击
- 可以帮助验证平行趋势假设的合理性
什么情况下应该加控制变量?
应该加
- 控制变量在处理前就已存在且不受处理影响
- 控制变量可能与结果变量相关,加入后能提高效率
- 需要控制与处理同时发生的其他政策冲击
不应该加
- 控制变量本身是处理的结果(坏控制)
- 控制变量与处理变量高度相关(共线性)
- 没有明确的理论依据说明需要控制
坏控制问题
坏控制(Bad Controls)是指那些本身受到处理影响的变量。将其加入回归会"控制掉"一部分处理效应,导致估计偏误。
例:研究教育对收入的影响时,加入"职业类型"作为控制变量是坏控制,因为教育可能通过影响职业选择来影响收入。
核心要点
- DID 的核心识别不依赖控制变量,但控制变量可以提高效率
- 只加入处理前就已确定的控制变量,避免坏控制
- 加入控制变量应有明确的理论依据
- 汇报结果时应同时报告有无控制变量的估计结果