DID 的思想起源:从霍乱地图到因果推断
追溯双重差分法的历史脉络——从 19 世纪 John Snow 的伦敦霍乱研究到现代计量经济学的基石,理解 DID 的核心思想如何诞生。
本文结构
- 起源:19 世纪伦敦霍乱与 John Snow 的洞察
- 突破:自然实验的雏形——伦敦供水改革
- 传承:从 Snow 到现代 DID 的学术脉络
- 现状:DID 在当代经济学研究中的统治性地位
第一层:思想起源
双重差分的直觉——一个拯救数千万人生命的研究
19 世纪的伦敦正遭受霍乱的肆虐,成千上万人因此死亡,而当时的医学界束手无策。
- 绝大多数人(包括最初的斯诺)都相信**"瘴气理论"**(Miasma),认为疾病是通过空气中微小的有毒颗粒传播的。
- 尽管采取了针对空气的预防措施(如隔离病人、甚至用粗麻袋盖住病人),但霍乱依然猖獗,这让斯诺开始怀疑主流理论。
早在 1855 年,英国 Snow 研究伦敦霍乱开始应用对比思维。
观察阶段
Snow 发现了一些关键线索:
- 水手只有在登岸补给后才会生病;
- 两栋相邻公寓,一栋居民严重感染,另一栋没有——区别在于前者的供水被污水污染,而后者的供水更干净。
由此他提出了新假设:霍乱是由一种有生命的有机体通过消化道进入人体,即通过受污染的食物或饮用水传播。
宽街霍乱地图

英国医生约翰·斯诺(John Snow)于 19 世纪 40 年代末在伦敦进行霍乱流行病学研究时绘制的著名地图,常被称为**"宽街霍乱地图"**(The Broad Street cholera map),它被认为是现代流行病学和空间数据分析的奠基性作品之一。
地图图例:
- 黑色圆点:霍乱死亡病例的位置
- 字母 P:标记的是水泵(Pump)的位置
- 黑色大圆点:受污染的水泵,即宽街水泵,是本次疫情的核心传播源
- 小方块或符号:建筑物或住房单元
死亡的空间分布
- 每点表示一例死亡
- 高度集中在宽街水泵(Broad Street Pump)周围
- 尤其以泵为中心形成密集的死亡簇
- 死亡人数最多的地方位于水泵正前方的一处住宅区(即后来发现的"宽街 6 号"附近)
第二层:因果推断的关键突破
问题:观察的局限
仅凭观察无法完全排除贫困、卫生条件等其他因素的影响,斯诺需要更有说服力的证据来证明因果关系。
理想情况:让斯诺通过抛硬币随机决定谁喝脏水、谁喝净水,然后比较死亡率。
然而,这种物理随机化在现实中既不切实际也不道德。社会科学家需要寻找现实中自然发生的、类似随机实验的场景。
关键突破:1854 年的伦敦供水变革
- 为了获取更干净的水,Lambeth 公司将取水口移到了泰晤士河上游(避开了下游的污水排放点);
- Southwark and Vauxhall 公司则维持原状,继续在受污染的下游取水口取水。
斯诺发现这两家公司服务的社区和人群在贫困程度、卫生习惯等观察因素上非常相似。
唯一的区别在于:一家公司变了,另一家没变。

这就是 DID 的核心逻辑
比较两组在政策/事件前后的变化差异,从而剥离出政策的真实效应。
Snow 的研究虽然没有使用"双重差分"这个术语,但他已经掌握了其核心思想:找到两个可比较的群体,观察其中一个受到"处理"而另一个没有,然后比较它们的变化。
第三层:从 Snow 到现代 DID
学术传承脉络
| 时间 | 人物/事件 | 贡献 |
|---|---|---|
| 1854 | John Snow | 伦敦霍乱研究,自然实验的雏形 |
| 1984 | Ashenfelter & Card | 普林斯顿大学,现代计量经济学中系统应用并普及 DID 的奠基性工作 |
| 2005 | 周黎安、陈烨 | 中国学者首次使用 DID 模型,对我国农村税费改革的效果进行系统评价 |
DID 在当代的使用
NBER(工作论文)中使用的方法统计显示,DID 已成为因果推断领域中使用频率最高的方法之一。

图片来源:黄炜,张子尧,刘安然.从双重差分法到事件研究法[J].产业经济论,2022,(02):17-36.
中文顶刊中的 DID
在 2019~2021 年间发表于《经济研究》《管理世界》《经济学(季刊)》《世界经济》和《China Economic Review》的文章中,通过检索"双重差分""倍差""双重固定效应""双向固定效应""事件研究"等关键词,共有 473 篇主要运用 TWFE 回归方法。
其中,119 篇文章未涉及因果推断框架,归入"其他"类别。

林梦芸,徐阳,郭汝飞,等.在模型误设的统一框架下理解双重差分方法的最新发展[J].管理世界,2025,41(06):227-264.
核心启示
- DID 的本质不是某种复杂的统计技巧,而是一种因果推断的逻辑——通过自然实验找到接近随机化的场景。
- Snow 的贡献不仅在于发现了霍乱的传播途径,更在于他展示了如何用对比思维从观察数据中逼近因果。
- 现代 DID 的繁荣:从 Ashenfelter & Card (1984) 到今天,DID 已成为实证经济学中最主流的方法之一。
下一步
- 标准 DID 与 TWFE:系统学习 DID 的模型设定、估计与推断
- 平行趋势检验:理解 DID 的核心识别假设
参考文献
- Snow, J. (1855). On the Mode of Communication of Cholera. London: John Churchill.
- Ashenfelter, O., & Card, D. (1984). Using the Longitudinal Structure of Earnings to Estimate the Effect of Training Programs. Review of Economics and Statistics, 67(4), 648-660.
- 周黎安, 陈烨. (2005). 中国农村税费改革的政策效果: 基于双重差分模型的估计. 经济研究, (8), 42-53.
- 黄炜, 张子尧, 刘安然. (2022). 从双重差分法到事件研究法. 产业经济论, (2), 17-36.
- 林梦芸, 徐阳, 郭汝飞, 等. (2025). 在模型误设的统一框架下理解双重差分方法的最新发展. 管理世界, 41(6), 227-264.