Skip to content

Latest commit

 

History

History
9 lines (5 loc) · 13.2 KB

File metadata and controls

9 lines (5 loc) · 13.2 KB

<第三十一期•天玑>统计因果【“科学解释”专栏】

“宗教、算命或风水命理的因果往往不明显、虚无缥缈。例如,基督教认为人有原罪。为何?因为亚当和夏娃吃了禁果。试想,假如我说,恐龙绝种是由于我今天吃了叉鹅饭,又如,我今天吃了酸辣汤面所以世界会有末日,富理性思维的人会相信吗?” 【编者按】 一直关注北斗的读者们,大约还记得几期前的天权曾刊登过一篇名为《管窥成语,洞见科学》的文章,其作者正是本月专栏写手XXX。在接下来的一个月里,他将继续从科学入手,为大家带来一篇篇妙文。下面,请听作者为栏目初张而给北斗读者们的寄语。 【作者寄语】 鲁迅和郭沫若弃医从文,张系国和陈之藩分别搞计算机和工程学,都没有运用他们的科学知识推动普及科学﹝简称科普﹞写作。近代中华民族不只科学成就不如西方,就连科普界的作品亦远比西方少。华文科普界,亦以翻译之量较多、质较高。结果自然是一般国民对科学的认识不够。 方舟子说:「美国国民的科学素养在许多方面都高于甚至远高于中国国民。有百分之七十的美国国民表示对了解科学新发现感兴趣,并有近百分之二十的人自认为对科学新发现非常理解,而仅有近百分之四十的中国国民表示对科学新发现感兴趣,自报非常理解的还不到百分之五。中国国民对科学研究的方式很了解的人只有百分之一,有一些了解的只有约百分之三,而美国国民有约百分之二十七的人对科学研究的方式有最起码的了解(即至少知道科学研究要做实验)。」﹝见〈科学普及塑造第一科技强国〉﹞小寒更以为:「近年来,世界科技革命成果迭出,当一些最令人震惊、最能改变人类命运的科学发现进入民众的日常生活时,我们那些最强调终极关怀的主流文学家们似乎都销声匿迹了。」﹝见〈中国作家何以成为最大的科盲群落〉﹞ 本系列旨在介绍为一般人忽略和较近代的的科学知识,以及评介西方著名的科普读本,浓缩和提炼,并作适当的批判。我们要了解科学的应用如医学之救生命,同时亦要觉察科学带来的危机如全球暖化,才能以公正和不偏颇的角度看科学。 【专栏正文】

统计因果

文/某留学生

凡模型皆错,然有些有用 - George Box 110 在那细雨朦胧烟雾弥漫的夜里,你深爱的情人跟你说他想跟你分手。虽然天没闪电,但你心如雷劈。你不服。你追问他。他说:「我今天的离去是为了你的将来。」你可甘心?他说:「你是好人但我不可跟你在一起。」你可甘心?他说:「我们前世是冤家所以今世多争吵。」你可甘心?日常生活常遇到因果,有些看似想当然,有些看似无关联。本文提倡的统计因果是解释世界的可靠有用工具。统计因果,即运用统计方法研究事件的关系,透过统计分析关系的强弱,我们可以清楚知道可靠程度。下文先述世间含糊的因果理论,再探讨现代科学所依赖的因果:统计因果。简述统计因果的三个条件后,较详细地讨论关系,接着的议题为因果模型。 宗教、算命或风水命理的因果往往不明显、虚无缥缈。例如,基督教认为人有原罪。为何?因为亚当和夏娃吃了禁果。试想,假如我说,恐龙绝种是由于我今天吃了叉鹅饭,又如,我今天吃了酸辣汤面所以世界会有末日,富理性思维的人会相信吗?基督徒辩称,《圣经》是神圣的所以内容皆为直理。但何为神圣?其实神圣一词甚空泛。所谓空泛,即使用范围没有任何界限,当某宗教词穷时便会以一些空泛的词汇「解释」,实为蒙蔽[1]。有宗教训言「今天的因是明天的果」,似有句意阙如之嫌。要知道,意思清楚明确的词,都可堆砌成没意义的句子。你知道「今天的因子是明天的苹果」是什么意思吗?你知道「如果花草所以无花果」是什么意思吗?追问之下,那宗教或会解说「你今世做了坏事来世会有报应」。但他们仍然没有解释「今世做了坏事」跟「来世有报应」有什么直接明显的关联。张海澎 [2]曾举一例如下,算命先生说在你在某年某月某日生,星系处于某位置,所以影响你的命运,这其实是转移问题,为何星系位置会影响你的命运呢?算命先生只在牵强附会。Paul Kurtz 在评议超心理学是否科学时道:「谈论科学时我们探究近似律法的陈述:即,若甲,则乙;每当甲在场,乙很可能发生。看看超心理学的发现,我们连乙是否会发生也不能确定[3]。」伪科学的因果往往含糊或颠倒。 210 现代科学理论的因果关系有别于上段所述的。艾耶尔以为我们相信当代科学的方法皆因其在实践上的成功[4]。现代科学所揭示的因果,远比宗教、算命或风水命理可靠。所谓可靠,并不等于必然。David Kenny 谈论相关和因果时表明,没有必然,只有或然;科学家不应该说「真」和「证明」,但要常常记住这些词[5]。Kenny 之言针对科学,包括自然科学和社会科学,我看数学和逻辑应作别论。因果和概率的关系,维根斯坦说得简洁:「若甲遵循自乙,命题乙给予命题甲的概率为一。逻辑结论的必然是概率的限制事例[6]。」而不可能的事件概率为零。﹝留意反之不必然,概率为零不能推出不可能[7]。﹞而一与零之间,就是理性信念程度。概率数值越接近一信念越强,越接近零信念越弱。借艾耶尔的话,说某观察削弱了命题的概率,不啻称我们越来越不想将那命题作为认可假说并供日后参考[8]。﹝留意学界对概率解释不一,如频率派和贝叶斯派,然这些不在本文研讨之列。﹞尽管科学理论不是必然,但很可靠。粗略而言,逻辑和纯数学最可靠,应用数学和自然科学次之,社会科学紧随,伪科学和非科学不大可靠。李天命[9]曾作更仔细的排名: 最可靠:逻辑、数学 非常可靠:物理学、化学 相当可靠:生物学、医学 不大可靠或大不可靠或未达相当可靠程度:心理学、经济学、管理学、社会学、教育学、所谓的「文化研究」 现在看看科学论述的因果关系。Kenny [10]称科学家普遍接受三个条件: 一、时间先后 二、关系 三、非伪造性 先谈第一点,假如甲引致乙,那甲在时间上要先于乙发生。「由于人类将会受到大审判,所以我们现在怎样怎样」之类的言论就不符合这点。第二,假如甲引致乙,甲和乙要存有关系。测试甲和乙有没有关系,可以用一些统计测试。透过统计测试,我们可以知道关系有多大,这是确实客观的数据。信神者称,神是善的由于牠引致善物[11]。神和善物有何关系?信神者没有表明。而科学理论涉及的关系,是要有统计测试支持的。第三,假如要说甲引致乙,那就不能存在一个可引致甲和乙的第三者丙,以致这个丙一旦受控就会使甲和乙的关系消失[12]。 简述了科学因果的三个条件,我们详细探讨第二点:关系。统计 学中,我们称两个没有关系的事件为独立﹝statistically independent﹞。假如我们知道两者有关系,还可以用协方差﹝covariance﹞或相关系数﹝correlation﹞来表示关系的强弱。若两事件独立,协方差为零。﹝反之不必然。﹞这些数值有助我们了解事件的关系,即甲和乙有没有关系、关系有多大,但不能显示因果﹝是甲引致乙还是乙引致甲﹞。关联性﹝statistical association﹞可能有助解释因果。Mark Woodward [13]举了一个简单例子:当一群人参加了一个晚宴,当中一些人宴后患病。假若每位患病者都吃了同一种食物而病,所有没吃那食物的人都安好无恙,那末该食物跟病明显有关联性。然而,确立关联性只是确立因果的必要,而绝非充足条件[14]。假如有第三者丙,而丙影响甲和乙的关系,我们还有交络﹝confounding﹞和相互作用﹝interaction﹞等等的课题讨论,看官有兴趣可参看 Woodward 那本《流行病学──研究设计和资料分析》。 数学模型是解释世界的有用工具。统计模型透过分析收集所得的确实数据,从而做出推测。达尔文的表亲高尔顿﹝Francis Galton﹞是回归分析的开山大师。他曾研究父母跟孩子高度的关系,发现个子高跟个子低的父母的孩子的高度,看似回复那群人的算术平均数。这是现代回归模型的先驱[15]。我们谈因果,可看看因果模型﹝casual modeling﹞。Kenny [16]列举三点解释社会科学宜用因果模型。其一,多数研究员含蓄或直率地﹝implicitly or explicitly﹞建构模型,正式的发展方法可协助研究员。其二,因果模型有助发展、修改和伸展出自测量和坚固的理论。其三,因果模型予社会科学家较强的基础准则从而解决社会问题。Kenny [17]亦列举三个因果模型的限制。其一,研究和资料必要建基于坚牢的仔细观察。其二,理论的中心概念或操纵主题通常不是因果法则,而是图像、概念和结构。其三,因果模型容易引起滥用。欲深入研究者可看看 Kenny 那本《相关与因果》。 通过统计分析,我们可以清楚知道推测结果有多可靠,如我们可以说九成五确信我们的推断。宗教、算命或风水命理的推断呢?我希望有一成可信。严谨的因果模型,宜以统计方法辅助。 二零零八年七月九日;十一日修订 特别鸣谢思想者思想俱乐部佣懒的人的意见。 注 翻译实难,自知拙译甚劣,尽量附原文供读者参考。 [1] 张海澎:《分析逻辑──理性思维的基石》 ﹝香港:青年书屋,2004 年 6 月初版﹞,页 34。 [2] 同上书,页 41。 [3] 原文为:We say in science that we search for conditional lawlike statements: namely, that if a, then b; whenever a is present, b will most likely occur. Yet in viewing the findings of parapsychology, the situation seems to be that we are not even certain that b occurs. 见 Paul Kurtz, Is Parapsychology a Science? in Kendrick Frazier (ed.) Paranormal Borderlands of Science. Buffalo, New York: Prometheus Books, 1981, p.13. [4] 原文为:We trust the methods of contemporary science because they have been successful in practice. 见 A.J. Ayer, Languages, Truth and Logic. London: Penguin Books, 2001, p.101. [5] 原文为:There is no certainty, only a probability. 和 the scientist should never speak the words truth or proof but always keep in them in mind. 见 David A. Kenny, Correlation and Causality. (Revised ed.) 2004. http://davidakenny.net/doc/cc_v1.pdf, p.1-2. [6] 原文为:If p follows from q, the proposition q gives to the proposition p the probability 1. The certainty of logical conclusion is a limiting case of probability. 转引自 Karl Popper, The Logic of Scientific Discovery. London and New York: Routledge, 2002, p.136. [7] 原文为:Probability Zero Does Not Mean Impossible. 见 Morris H. DeGroot and Mark J. Schervish, Probability and Statistics. (3rd international ed.) Addison-Wesley, 2002, p.17. [8] 原文为:to say of an observation that it diminishes the probability of a proposition is to say that it decreases our willingness to included the proposition in the system of accepted hypotheses which serve us as guides to the future. 同注 4,p.100. [9] 李天命:《哲道行者》 ﹝香港:明报出版社,2005 年 7 月 3 版﹞,页 135。 [10] 原文为:Three commonly accepted conditions must hold for a scientist to clam that X causes Y: 1. time precedence 2. relationship 3. nonspuriousness. 同注 5,p.3. [11] 原文为:God is good because he is the cause of things that are good. 见 Brain Davies, An Introduction to the Philosophy of Religion. (2nd ed.) Oxford, New York: Oxford University Press, 1993, p.21. [12] 原文为:For a relationship between X and Y to be nonspurious, there must not be a Z that causes both X and Y such that the relationship between X and Y vanishes once Z is controlled. 同注 5,p.4-5. [13] Mark Woodward, Epidemiology: Study Design and Data Analysis. Boca Ration, London, New York, Washington, D.C.: Chapman & Hall/CRC, 1999, p.14-15. [14] 原文为:The establishment of an association is a necessary, but certainly not a sufficient, condition to establish causation. 同注 13,p.17. [15] Michael H. Kutner, Christopher J. Nachtsheim, John Neter and William Li, Applied Linear Statistical Models. (5th international ed.) McGrwa-Hill Higher Education, 2005, p.5. [16] 同注 5,p.6. [17] 同注 5,p.8-9.