近年来,人工智能技术取得了长足的进步,DeepMind公司的AlphaGo横扫世界围棋顶尖高手,AlphaFold能够精确地基于氨基酸序列来预测蛋白质结构,其准确性可以与使用冷冻电子显微镜(CryoEM)、核磁共振或X单晶衍射等方法解析蛋白质结构的准确性相媲美。人工智能技术在许多领域取得了不可思议的进步,语音翻译、图像场景识别等曾是科幻小说中梦想的成就,现在已经成为现实。在技术突破和市场需求的多方驱动下,人工智能技术已经从学术走向实践,正加速向各个产业渗透,改造各行各业。如同蒸汽时代的蒸汽机、电气时代的发电机、信息时代的计算机和互联网,人工智能正成为推动人类进入智能时代的决定性力量。但是,现有的人工智能技术几乎都是基于统计学或黑箱的形式,主要关注变量之间的相关性而非因果性,这使其性能有严重的理论局限性。它在动物擅长的一些技能方面表现并不好,特别是将解决问题的能力迁移至新问题,以及进行任意形式的泛化时。一些常识问题对于人类而言很简单,但对于现在的人工智能技术而言并不简单。因此,2011年图灵奖得主、贝叶斯网络之父朱迪亚·珀尔(Judea Pearl)教授认为,现在人工智能技术的发展进入了新的瓶颈期,“所有令人印象深刻的深度学习成果加起来不过是曲线拟合罢了”(All the impressive achievements of deep learning amount to just curve fitting),而且“深度学习技术是一种非常通用和强大的曲线拟合技术,它可以识别以前隐藏的模式,推断出趋势,并预测出各种问题的结果,但它仅仅停留在相关性这个层次上,也就是曲线拟合,而曲线拟合方法在表示给定数据集方面的一个风险是过度拟合,即算法不能识别出数据中的正常波动,最终会被干扰所迷惑”。珀尔认为,除非算法及其控制的机器能够推理因果关系,或者至少概念化差异,否则算法的效用和通用性永远不会接近于人类。麻省理工学院(MIT)的研究人员发表的一篇论文也指出,要创建类人的学习和思考的机器,需要它们能够构建出世界的因果模型,能够理解和解释它们的环境,而不仅仅是使用模式识别来解决问题。因此,现有的人工智能技术需要超越现在的相关性关系层次,深入探究因果关系,最终制造出像人一样思考的机器。因果关系一直是人类认识世界的基本方式,也是现代科学的两大基石之一。自古以来,关于因果关系的研究一直吸引着人们。通过系统性观察和试验发现自然规律、探索现象之间的因果关系,一直是各种科学研究的最终目标。爱因斯坦就认为西方科学是建立在以因果律为基础的形式逻辑之上的。相关性关系与因果关系之间的关系由莱辛巴赫(Reichenbach)形式化为著名的共同原因原理,即如果两个随机变量X和Y在统计学上具有相关性,那么其相互关系必为以下关系之一:● X导致Y;● Y导致X;● 存在一个随机变量Z,它是引起X和Y的共同原因。因此,与相关性关系相比,因果关系具有更多的信息量,体现了变量之间更本质的关系。因果推断的中心任务就是研究变量之间的因果关系:● 分析如果某些变量被干预会发生什么;● 分析影响干预及其结果的混杂因素;● 分析以前从未观察到的情况的结果。因果关系与相关性关系不同,相关性关系指的是,如果我们观测到了一个变量X的分布,就能推断出另一个变量Y的分布,那么说明X和Y是有相关性的。而因果性则强调,如果我们干预了某个变量X,且这种干预引起了变量Y的变化,那么我们才能说明X是Y的因(cause),而Y是X的果(effect)——这是因果关系的基本出发点。基于因果关系的分析方法,我们可以避免得出“制止公鸡打鸣就可以阻挡日出”这样荒谬的结论。因此,基于因果关系的预测方法比基于相关性关系的预测方法更具有普适性。我们在人工智能研究中需要寻找这样的因果关系,而不仅仅是简单的相关性关系。除人工智能研究领域之外,因果推断在经济学、社会学、医学和法学等领域也有广泛的应用。比如,在广告界有一句广为流传的话:“我知道我的广告费有一半被浪费了,但遗憾的是,我不知道是哪一半被浪费了。”这实际上是一个衡量广告效果的问题。因为无法很精确地衡量广告的效果,所以没办法进行进一步的广告投放优化,只能白白浪费广告费。从因果推断的角度来看,如果我们把投放广告看作一种“干预”(intervention),这个问题其实就是广告投放的因果效应分析问题,需要我们通过因果推断的方法进行分析。从数据中分析、挖掘相关性关系的研究发展迅速,相关学习资料也很多,但因果推断方面的学习资料还相对较少。国外有少量关于因果推断的书籍。Judea Pearl教授在因果推断方面有三本著作:The Book of Why: The New Science of Cause and Effect、Causal Inference in Statistics: A Primer和Causality: Models,Reasoning,and Inference。耶鲁大学Scott Cunningham教授编写的Causal Inference:The Mixtape 2021年刚出版。哈佛大学流行病学家James Robins和他的同事也在写一本关于因果推断的书,目前提供了网络版。这些书籍从不同角度对因果推断进行了介绍,并且对因果推断各个方面的问题都有比较精辟的论述,但对于因果推断的初学者而言,这些材料相对较难。因