双重差分(DID)
稳健性检验安慰剂

14_安慰剂检验

Abadie & Dermisi(2008)

作者:计量科研导航站发布:2026-04-14★★

安慰剂检验:验证因果识别的可信度

安慰剂检验(Placebo Test)是 DID 实证研究中最重要的稳健性检验之一。其核心思想是:如果在"不应该有效果"的场景下检验出了"效果",说明原结果可能不可信。


一、为什么需要安慰剂检验?

即使 DID 估计结果显著且符号符合预期,仍可能存在以下问题:

  • 平行趋势假设不成立,结果由预处理趋势驱动
  • 遗漏了与处理同时发生的其他政策或冲击
  • 结果变量本身存在与处理无关的时间趋势

安慰剂检验通过构造"反事实"场景,验证结果是否真的由处理引起。


二、三类安慰剂检验

1. 伪处理时间(Fake Treatment Timing)

将处理时间人为提前若干期(如 2 年或 3 年),然后用同样的 DID 方法估计"处理效应"。

预期结果:如果 DID 识别可信,伪处理时间的估计效应应不显著

// 将处理时间提前 2 年
gen placebo_treat = (year >= treat_year - 2) & treat == 1
reghdfe y placebo_treat, absorb(id year) cluster(id)

2. 伪处理组(Fake Treatment Group)

选择一个理论上不应受政策影响的群体,将其设定为"伪处理组"进行 DID 估计。

预期结果:伪处理组的估计效应应不显著

例如:某政策只影响制造业企业,可以选择服务业企业作为伪处理组。

3. 伪结果变量(Fake Outcome Variable)

选择一个理论上不应受政策影响的变量作为"伪结果"进行 DID 估计。

预期结果:伪结果变量的估计效应应不显著

例如:最低工资政策不应影响企业的研发投入,可以用研发支出作为伪结果。


三、解释安慰剂检验结果

通过检验

安慰剂检验结果不显著(p > 0.1),说明:

  • 原结果不太可能由预处理趋势驱动
  • 增强了因果识别的可信度

未通过检验

安慰剂检验结果显著,需要进一步排查:

  • 平行趋势假设是否成立?
  • 是否存在遗漏的混淆因素?
  • 是否需要更换控制组或调整时间窗口?

注意:安慰剂检验未通过不等于结果一定错误,但需要更谨慎地解释和更多的稳健性检验。


四、安慰剂检验的局限性

  1. 统计功效问题:安慰剂检验的样本量通常较小,统计功效较低
  2. 多重检验问题:进行多次安慰剂检验时,至少有一次显著的概率会增加
  3. 不是平行趋势的直接证据:安慰剂检验只能提供间接证据

核心要点

  1. 安慰剂检验是 DID 实证研究的标准配置
  2. 三类检验各有侧重,建议同时使用
  3. 结果解释需结合具体情境,避免机械套用
  4. 安慰剂检验通过 ≠ 因果识别一定正确,只是增强了可信度