因果科学的历史
Published:
一、哲学中的因果关系
关于“因”和“果”的哲学讨论可以追溯到古希腊。亚里士多德在《物理学》中提出提出了运动的四个原因:质料因、形式因、动力因和目的因。例如,对于一件精美的雕塑来说,石头是质料因,雕塑的形状是形式因,雕刻家的打磨是动力因,给人们观赏是目的因。亚里士多德的“因”更多地关注一个事物为什么会成为它本身,而不是和“果”联系起来。十一世纪的经院哲学家和科学家罗伯特·格罗塞斯特对因果推断的实践很感兴趣。为了探究哪些草药会带来人们期待的效果,他创造了一种归纳推理程序,旨在找出造成差异的因素。这一方法与后来约翰·斯图亚特·密尔的“差异法”很相似。
对于因果关系的正式讨论主要分为五个流派。第一是规律性流派,这一流派起源于大卫·休谟,他把因果关系简化为事件的共发性。作为经验主义哲学家,休谟认为,只要事物之间存在某种规律性,那么就存在因果关系。第二是概率主义流派,这一流派试图通过寻找条件概率的变化来定义因果关系。经济学“格兰杰因果”的概念正是收到了时间序列时间先后顺序的启发。第三是反事实流派,这一流派也被认为是由大卫·休谟所建立,因为休谟在定义因果关系时给出了两种看起来相同但实际又不相同的定义,其中一个定义是从规律性角度出发的,另一个是从反事实角度出发的。第四是机械论流派,也被称为因果过程流派,这一流派认为从因到果有一个明确的物理过程,基于理论的经济学、复杂系统理论都可归结为这一流派。第五是操纵主义流派,这一流派认为因和果是成对出现的,结果实际上是不同干预类型造成的差异。现代统计学关于因果推断的研究大多采取操纵主义观点。
在近代哲学中,有关因果关系的争论主要集中在一个问题:什么是因,什么是果。哲学家花费了大量的精力,试图从纷繁复杂的元素中寻找一件事物的原因。英国经验主义哲学家约翰·洛克在他的著作《人类理解论》中首次正式提出了因和果的概念:我们把产生观念的事物叫做原因,把所产生的东西叫做结果。作为经验论者,洛克认为不存在先天经验,只有通过感知才能认识世界。假设你的面前有一个苹果,太阳光在苹果表面的反射在你的视网膜上形成了影像,于是你会认为你的面前有一个苹果,那么苹果是原因,你大脑中“面前有一个苹果”的观念是结果。
另一个英国经验主义哲学家大卫·休谟进一步贯彻了经验主义。休谟不承认任何物理实体和精神实体,他对因果关系展现出了一种怀疑论立场。在休谟看来,因果不是事实之间的概念,而是经验之间的概念。由于我们日常生活中对因果关系的认知基于归纳,因此所谓因果关系不过是主观的习惯性联想。休谟强调判断因果关系的三条准则:空间邻近性、时间连续性、恒常连结性。正如笛卡尔学派批评牛顿万有引力的“超距作用”,因果关系在时空上应当统一的观点对休谟科学观的发展至关重要。现代心理学研究发现,人们认识因果关系的过程与休谟的论断十分相符,而时间连续性是比空间邻近性更重要的信号。例如,人们会说太阳升起是公鸡打鸣的原因。事实上,公鸡大脑中存在一个叫做松果体的器官可以分泌褪黑素,松果体对光线特别敏感,只要有微弱的光线,松果体分泌褪黑素就会被抑制,使公鸡醒来打鸣。然而,休谟判断因果关系的方法存在问题,按照休谟的定义会产生一个悖论:白天是黑夜的原因,黑夜是白天的原因。这种循环因果显然没有意义。
休谟被公认为是因果还原论之父,但他的观点却因内部不一致而存在各种解释。休谟在《人类理解研究》中描述因果关系时写道,“第一个事物出现在第二个事物之前,而且所有与第一个事物类似的事物出现之后,都会出现与第二个事物类似的事物。”这句话是规律性推理。随后他又写道,“换句话说,如果第一个事物不出现的话,那么第二个事物也永远都不会出现。”与前一句不同,这句话是反事实推理。在休谟的启发下,现当代哲学家大卫·刘易斯推广了休谟对因果关系的第二种定义,提出了判断因果关系的反事实推理法:“如果C发生了,E就会发生;如果C不发生,E就不会发生。”刘易斯在新的理论中纳入了事件和空间,“当C和E是不同的实际事件时,我们说C影响了E,当且仅当C的不同变化(包括C的实际变化)有一个很大的范围C1、C2、……,而E的变化也有一个范围E1、E2、……,其中至少有一些是不同的,这样,如果C1发生了,E1就会发生,如果C2发生了,E2就会发生,依此类推。这样,我们就有了‘如何、何时、是否’与‘如何、何时、是否’之间的依赖模式。”除了包含时空联系的要求之外,刘易斯还通过“逐步影响”发展了他的反事实因果关系理论,这使得这一反事实理论类似于机械论。
约翰·斯图亚特·密尔在研究因果关系时弱化了恒常连结性,取而代之的是为连结事件添加某些必要联系。与洛克和休谟这些经验论者不同,密尔采纳了康德的存在先天经验的观点。密尔提出了判断因果关系的五种非正式策略:契合法(某个原因是导致某种结果的必要条件,即,除非出现这个原因,否则不会出现这种结果)、差异法(某个原因是导致某种结果的充分条件,即,如果出现这个原因,就一定会出现这种结果)、契合差异并用法、共变法(在其他条件不变的情况下,如果某一现象发生变化另一现象也随之发生相应变化,那么,前一现象就是后一现象的原因)、剩余法(如果某一复合现象已确定是由某种复合原因引起的,把其中已确认有因果联系的部分减去,那么,剩余部分也必有因果联系)。密尔强调了实验的重要性,他认为,如果不依赖于演绎推理,那么没有实验的观察可以获得序列和共存,而不能证明因果关系。休谟对实验的重视于现代统计学观点如出一辙——仅仅通过观察性研究不能得出因果结论。
休谟基于恒常连结的观点后来被重新表述为概率主义观点。逻辑实证主义哲学家汉斯·赖欣巴哈试图用概率语言严格表述因果关系,这样,人们就能够通过某种客观的方式建立因果关系。赖欣巴哈认为,因果关系的一个重要特点是不对称性。由于函数方程缺乏非对称性,因此函数方程没有因果解释。如果概率蕴涵只在一个方向上有效,那么“前因”就是时间上较早的事件。他提出了共同原因准则,也就是由“叉结构”引起的不对称性,这一准则与现代统计学因果发现理论的马尔可夫条件十分接近。“控制理论之父”诺伯特·维纳在赖欣巴哈编撰的《现代工程数学》“预测理论”一章中,对两个连续函数之间的因果关系下了如下定义:“对于两个同时测量的信号S1和S2,如果利用S1过去的信息比不利用S1的信息能更好地预测S2,那么我们就称S1对S2有因果关系”。这一定义约束函数变量而非事件,激发了格兰杰因果的概念。分析哲学家帕特里克·苏佩斯反对休谟的恒常规律性推理,因为日常的因果关系概念并不具有鲜明的决定论特征。他进一步定义了初步原因、虚假原因和真实原因。
约翰·莱斯利·麦基为因果关系提出了INUS定义:“所谓原因,就是结果的一个充分但不必要条件组中的一个必要但不充分的组成部分”。如果一方面,事件A加上其他某些事件可以组成一个复合事件C,事件C是事件B的充分条件,另一方面,如果把事件A从事件C中拿掉,事件C就不再是事件B的充分条件,那么我们就说事件A是事件B的原因。麦基的观点在法律学中受到广泛认可。例如,甲将乙从高楼上推下来,乙落地后死掉了。通常认为甲需要对乙的死负责,但“甲推乙下楼”既不是“乙死亡”的充分条件也不是必要条件。然而按照麦基的定义,“甲推乙下楼”加上“地面是硬的”就构成了“乙死亡”的充分条件。“甲推乙下楼”是这个充分但不必要条件组中的一个必要但不充分部分,因此“甲推乙下楼”是乙死亡的原因。
除了哲学界,流行病学领域也关心因果关系。布拉德福德·希尔提出了在流行病学中研究因果关系的著名“希尔准则”:强度(关联强度越大存在因果关联的可能性越大)、一致性或可重复性(某因素与某疾病的关联在不同研究背景下、不同研究者均可获得一致性的结论)、特异性(某因素只能引起某种特定的疾病)、时序性(有因才有果,作为原因一定发生在结果之前)、生物梯度:指某因素暴露的剂量、时间与某种疾病的发生之间存在的一种阶梯曲线、生物学合理性(所观察到的因果关联可以用已知的生物学知识加以合理解释)、可信度与连贯性(没有与现有理论冲突,与上一条准则相似)、实验证据(用实验方法去除可疑病因引起某疾病发频率的下降或消灭)、类比性(将某个已知的因果关系类比至其他相似的关系上,并依此推论其因果关系存在与否)。尽管希尔准则看起来丰富,但它们仍然属于规律性推理的范畴。
二、统计学中的因果推断
与哲学家不同,统计学家在探讨因果关系时更加侧重原因的结果,而不是结果的原因。统计学的因果推断与生物统计的发展紧密相关。弗朗西斯·高尔顿在研究身高的遗传规律时,发现父母身高越高,那么孩子的身高也越高,他提出用梅花机(高尔顿板)解释身高的代际传播,尽管存在随机性,但似乎同时也存在某种力量将后代身高往平均水平拉动,因此维持了代际之间身高分布的稳定。高尔顿提出了“回归”的概念,并在几年后又提出了“相关性”的概念。作为高尔顿的助手,卡尔·皮尔逊提出了“相关系数”的概念。他认为,统计学的核心是研究相关性,而不是追求神秘莫测的因果性。皮尔逊发现了很多看似相关但实际没有内在关联的现象,他称这种现象为“伪相关”。皮尔逊和学生尤尔收集了很多伪相关的实例,后来被称为“尤尔—辛普森”悖论。遗憾的是,皮尔逊本人没有意识到因果性在这些悖论背后的重要性。
赌博时抽签或洗牌是公平的想法可以追溯到几千年前,但使用实际随机性作为因果推断的基础要归功于因果统计学家罗纳德·费希尔。费希尔关注生物统计和农业试验。费希尔于1925年出版了《研究者的统计方法》,在书的最后部分强调了随机试验的重要性。由于试验对统计研究太重要了,费希尔在1935年单独出版了一本《试验设计》。如何判断一种化肥能否提高农作物产量?费希尔的办法是,让研究者在试验田中随机选取若干地块施加化肥,如果施加化肥的地块与未施加化肥的地块在农作物产量上表现出差异,那么就能证明化肥是有效的。费希尔还提出了显著性检验的概念。在有限样本中,基于随机化,他对尖锐零假设(也就是个体处理效应为零)给出了随机化检验。
与费希尔同时代的波兰统计学家耶日·奈曼在1925年也从农业试验为出发点,在博士毕业论文中提出了“潜在结果”的概念。他认为,每个个体都存在两个潜在结果,即接受处理的潜在结果和不接受处理的潜在结果,而这两个潜在结果在实际中只能观察到一个。由于奈曼的论文用波兰语撰写,因此他在因果推断的早期工作直到二十世纪九十年代才受到重新关注。此外,奈曼还形式化了估计量、抽样方差、区间估计的覆盖度等概念。与费希尔显著性检验不同,奈曼强调备择假设在假设检验问题中的重要性,与埃贡·皮尔逊共同提出了著名的奈曼—皮尔逊引理。奈曼引入了抽样的概念,他认为有限样本是从一个更大的超总体中通过抽样获得的。对于不可加的处理作用,奈曼给出了平均处理效应的保守区间估计。
受费希尔和奈曼的启发,美国统计学家唐纳德·鲁宾把潜在结果推广到观察性研究也就是非随机化试验中。他把因果推断看成是缺失数据问题,由于试验设计,两个潜在结果中的一个自然无法被观测到,这是因果推断的基本问题。科学(因果作用)本身由潜在结果定义,对观测数据的建模反映了学习科学的过程。这一模型看起来简单,在当时没有引起太大关注,但随着时间发展,研究者越来越认可这一模型。鲁宾强调处理分配机制的重要性,提出了倾向性得分、主分层、重随机化等概念,促进了将工具变量引入到潜在结果模型,在缺失数据方面发展了多重填补、期望最大化(EM)算法。潜在结果模型有时也被称作奈曼—鲁宾因果模型,但这套模型的发展离不开费希尔、奈曼和鲁宾等统计学家的共同努力。
潜在结果框架立足于操纵主义观点。统计学家保罗·霍兰总结了对因果关系的四个研究方向:探究因果概念的终极意义、了解因果机制、追溯结果的原因、衡量原因对结果的作用大小。霍兰认为统计学研究因果关系时应当从研究原因的结果入手,而不是去追溯结果的原因,因为原因的结果容易定义,而结果的原因很难定义。当我们谈到原因的结果时,实际上实在比较两种类型的原因(比如吃药还是不吃药)。不是所有事物都能成为原因,只有能被操纵才能成为原因。比如,年龄不能被操纵,我们没有办法在其他条件都相同时仅仅改变年龄,因此讨论年龄的结果没有意义。简单地说,没有操纵就没有因果。
与费希尔几乎同时,美国遗传学家休厄尔·赖特以一种机械主义的观点探讨了因果关系。他在研究小鼠的毛色遗传规律时,创造了路径图以及路径分析,并提出了方法估计每条路径上的系数。路径分析图可以被看作是结果方程模型的前身,工具变量的概念也可以在赖特的工作中找到。
受路径图启发,朱迪亚·珀尔提出了贝叶斯网络和因果图。贝叶斯网络蕴含了人们对于因果关系的先验认知,用节点表示变量,用箭头表示因果作用。利用因果图,不仅能判断一个变量对另一个变量的因果作用能否识别,而且能够通过观测数据检验模型是否正确。更进一步,在忠实性假设下,基于观测数据可以发现变量间的因果关系。也有一些统计学家把潜在结果画到因果图上,提出了单一世界干预图。这样,识别因果作用的核心假设在图上体现出来了。
珀尔把统计学研究从相关性到因果性的跳跃成为因果革命。他认为,因果革命为统计学带来了新的维度。传统统计学基于对称的等式,而因果科学基于不对称的分配算子、箭头。因果革命反映了研究范式的转变。传统的数据主义范式认为所有的智慧都蕴含在拟合数据,所以任务是更好地拟合数据,而对因果性的研究是一种科学主义范式,科学主义范式不关心数据本身,而是关心世界的运行规则。科学主义范式的根基是对探索现实世界运行规则的提问。然而,为了获得因果结论,除了观测数据之外,研究者必须要有随机化试验或其他假设(例如无混淆性)。正如科学哲学家南希·卡特赖特所说,“若无因入,则无因出。”