双重差分(DID)
DIDHistory因果推断自然实验

DID 的思想起源:从霍乱地图到因果推断

追溯双重差分法的历史脉络——从 19 世纪 John Snow 的伦敦霍乱研究到现代计量经济学的基石,理解 DID 的核心思想如何诞生。

作者:计量科研导航站发布:2026-04-14★★★

本文结构

  1. 起源:19 世纪伦敦霍乱与 John Snow 的洞察
  2. 突破:自然实验的雏形——伦敦供水改革
  3. 传承:从 Snow 到现代 DID 的学术脉络
  4. 现状:DID 在当代经济学研究中的统治性地位

第一层:思想起源

双重差分的直觉——一个拯救数千万人生命的研究

19 世纪的伦敦正遭受霍乱的肆虐,成千上万人因此死亡,而当时的医学界束手无策。

  • 绝大多数人(包括最初的斯诺)都相信**"瘴气理论"**(Miasma),认为疾病是通过空气中微小的有毒颗粒传播的。
  • 尽管采取了针对空气的预防措施(如隔离病人、甚至用粗麻袋盖住病人),但霍乱依然猖獗,这让斯诺开始怀疑主流理论。

早在 1855 年,英国 Snow 研究伦敦霍乱开始应用对比思维。

观察阶段

Snow 发现了一些关键线索:

  • 水手只有在登岸补给后才会生病;
  • 两栋相邻公寓,一栋居民严重感染,另一栋没有——区别在于前者的供水被污水污染,而后者的供水更干净。

由此他提出了新假设:霍乱是由一种有生命的有机体通过消化道进入人体,即通过受污染的食物或饮用水传播。

宽街霍乱地图

宽街霍乱地图

英国医生约翰·斯诺(John Snow)于 19 世纪 40 年代末在伦敦进行霍乱流行病学研究时绘制的著名地图,常被称为**"宽街霍乱地图"**(The Broad Street cholera map),它被认为是现代流行病学和空间数据分析的奠基性作品之一。

地图图例:

  • 黑色圆点:霍乱死亡病例的位置
  • 字母 P:标记的是水泵(Pump)的位置
  • 黑色大圆点:受污染的水泵,即宽街水泵,是本次疫情的核心传播源
  • 小方块或符号:建筑物或住房单元

死亡的空间分布

  • 每点表示一例死亡
  • 高度集中在宽街水泵(Broad Street Pump)周围
  • 尤其以泵为中心形成密集的死亡簇
  • 死亡人数最多的地方位于水泵正前方的一处住宅区(即后来发现的"宽街 6 号"附近)

第二层:因果推断的关键突破

问题:观察的局限

仅凭观察无法完全排除贫困、卫生条件等其他因素的影响,斯诺需要更有说服力的证据来证明因果关系

理想情况:让斯诺通过抛硬币随机决定谁喝脏水、谁喝净水,然后比较死亡率。

然而,这种物理随机化在现实中既不切实际也不道德。社会科学家需要寻找现实中自然发生的、类似随机实验的场景。

关键突破:1854 年的伦敦供水变革

  • 为了获取更干净的水,Lambeth 公司将取水口移到了泰晤士河上游(避开了下游的污水排放点);
  • Southwark and Vauxhall 公司则维持原状,继续在受污染的下游取水口取水。

斯诺发现这两家公司服务的社区和人群在贫困程度、卫生习惯等观察因素上非常相似。

唯一的区别在于:一家公司变了,另一家没变。

供水公司对比

这就是 DID 的核心逻辑

比较两组在政策/事件前后的变化差异,从而剥离出政策的真实效应。

Snow 的研究虽然没有使用"双重差分"这个术语,但他已经掌握了其核心思想:找到两个可比较的群体,观察其中一个受到"处理"而另一个没有,然后比较它们的变化。


第三层:从 Snow 到现代 DID

学术传承脉络

时间 人物/事件 贡献
1854 John Snow 伦敦霍乱研究,自然实验的雏形
1984 Ashenfelter & Card 普林斯顿大学,现代计量经济学中系统应用并普及 DID 的奠基性工作
2005 周黎安、陈烨 中国学者首次使用 DID 模型,对我国农村税费改革的效果进行系统评价

DID 在当代的使用

NBER(工作论文)中使用的方法统计显示,DID 已成为因果推断领域中使用频率最高的方法之一。

NBER 方法统计

图片来源:黄炜,张子尧,刘安然.从双重差分法到事件研究法[J].产业经济论,2022,(02):17-36.

中文顶刊中的 DID

在 2019~2021 年间发表于《经济研究》《管理世界》《经济学(季刊)》《世界经济》和《China Economic Review》的文章中,通过检索"双重差分""倍差""双重固定效应""双向固定效应""事件研究"等关键词,共有 473 篇主要运用 TWFE 回归方法。

其中,119 篇文章未涉及因果推断框架,归入"其他"类别。

中文顶刊 DID 使用统计

林梦芸,徐阳,郭汝飞,等.在模型误设的统一框架下理解双重差分方法的最新发展[J].管理世界,2025,41(06):227-264.


核心启示

  1. DID 的本质不是某种复杂的统计技巧,而是一种因果推断的逻辑——通过自然实验找到接近随机化的场景。
  2. Snow 的贡献不仅在于发现了霍乱的传播途径,更在于他展示了如何用对比思维从观察数据中逼近因果。
  3. 现代 DID 的繁荣:从 Ashenfelter & Card (1984) 到今天,DID 已成为实证经济学中最主流的方法之一。

下一步


参考文献

  • Snow, J. (1855). On the Mode of Communication of Cholera. London: John Churchill.
  • Ashenfelter, O., & Card, D. (1984). Using the Longitudinal Structure of Earnings to Estimate the Effect of Training Programs. Review of Economics and Statistics, 67(4), 648-660.
  • 周黎安, 陈烨. (2005). 中国农村税费改革的政策效果: 基于双重差分模型的估计. 经济研究, (8), 42-53.
  • 黄炜, 张子尧, 刘安然. (2022). 从双重差分法到事件研究法. 产业经济论, (2), 17-36.
  • 林梦芸, 徐阳, 郭汝飞, 等. (2025). 在模型误设的统一框架下理解双重差分方法的最新发展. 管理世界, 41(6), 227-264.