双重差分(DID)
稳健性检验安慰剂
14_安慰剂检验
Abadie & Dermisi(2008)
作者:计量科研导航站发布:2026-04-14★★
安慰剂检验:验证因果识别的可信度
安慰剂检验(Placebo Test)是 DID 实证研究中最重要的稳健性检验之一。其核心思想是:如果在"不应该有效果"的场景下检验出了"效果",说明原结果可能不可信。
一、为什么需要安慰剂检验?
即使 DID 估计结果显著且符号符合预期,仍可能存在以下问题:
- 平行趋势假设不成立,结果由预处理趋势驱动
- 遗漏了与处理同时发生的其他政策或冲击
- 结果变量本身存在与处理无关的时间趋势
安慰剂检验通过构造"反事实"场景,验证结果是否真的由处理引起。
二、三类安慰剂检验
1. 伪处理时间(Fake Treatment Timing)
将处理时间人为提前若干期(如 2 年或 3 年),然后用同样的 DID 方法估计"处理效应"。
预期结果:如果 DID 识别可信,伪处理时间的估计效应应不显著。
// 将处理时间提前 2 年
gen placebo_treat = (year >= treat_year - 2) & treat == 1
reghdfe y placebo_treat, absorb(id year) cluster(id)2. 伪处理组(Fake Treatment Group)
选择一个理论上不应受政策影响的群体,将其设定为"伪处理组"进行 DID 估计。
预期结果:伪处理组的估计效应应不显著。
例如:某政策只影响制造业企业,可以选择服务业企业作为伪处理组。
3. 伪结果变量(Fake Outcome Variable)
选择一个理论上不应受政策影响的变量作为"伪结果"进行 DID 估计。
预期结果:伪结果变量的估计效应应不显著。
例如:最低工资政策不应影响企业的研发投入,可以用研发支出作为伪结果。
三、解释安慰剂检验结果
通过检验
安慰剂检验结果不显著(p > 0.1),说明:
- 原结果不太可能由预处理趋势驱动
- 增强了因果识别的可信度
未通过检验
安慰剂检验结果显著,需要进一步排查:
- 平行趋势假设是否成立?
- 是否存在遗漏的混淆因素?
- 是否需要更换控制组或调整时间窗口?
注意:安慰剂检验未通过不等于结果一定错误,但需要更谨慎地解释和更多的稳健性检验。
四、安慰剂检验的局限性
- 统计功效问题:安慰剂检验的样本量通常较小,统计功效较低
- 多重检验问题:进行多次安慰剂检验时,至少有一次显著的概率会增加
- 不是平行趋势的直接证据:安慰剂检验只能提供间接证据
核心要点
- 安慰剂检验是 DID 实证研究的标准配置
- 三类检验各有侧重,建议同时使用
- 结果解释需结合具体情境,避免机械套用
- 安慰剂检验通过 ≠ 因果识别一定正确,只是增强了可信度