科学革命的结构

BOOK NOTES

科学革命的结构

托马斯·库恩

托马斯·库恩(T. S. Kuhn)在1962年出版此书时,本职是科学史家。他在哈佛大学研究班期间系统研究了亚里士多德物理学、哥白尼天文学和燃素化学,发现这些已被废弃的理论各自具有内部逻辑,在其所处的时代都是相当自洽的知识体系。这个观察促使他重新审问:科学到底是怎样发展的?

本书的核心论点是:科学发展有周期性结构,它交替经历"常规科学"和"科学革命"两个阶段。常规科学是在某个共同框架(规范)内部解题的长期工作;革命是用新规范取代旧规范的非累积性转变。书中的大部分篇幅用于说明这两个阶段各自的机制,以及它们之间的过渡条件。

库恩的论述依赖大量历史案例:哥白尼日心说取代地心说、拉瓦锡的氧气理论取代燃素说、爱因斯坦相对论取代牛顿力学、富兰克林电学规范取代此前的以太理论。他把这些案例作为论证的证据,而非仅仅用于举例说明。

科学发展的阶段结构

前规范时期

一个学科在形成规范之前,各学派对基本问题各有一套答案,没有哪一套答案被全域认可。各派都在从第一原理出发建构理论,争论不断。以电学史为例,十七世纪中期存在多个互相竞争的电学流派,它们对电吸引的本质、电流的性质各持不同解释,研究工作无法在共同问题上积累。

前规范时期的特点是大量事实采集,但缺乏过滤:哪些观察是重要的,哪些只是偶然现象,在缺乏共同框架的情况下无从判断。培根式的百科全书式数据搜集就是这一时期的典型产物。

这个阶段的结束通常需要一项成就,它足够有说服力,以至于将多数从业者聚拢在同一套问题和同一套解法标准周围。富兰克林的电学著作完成了这件事,牛顿的《原理》对力学完成了同样的事。这样的成就就是第一个"规范"(paradigm)。

常规科学

规范确立之后,研究工作进入常规阶段。常规科学的工作分三类:

测定有意义的事实。规范指定了哪些事实特别值得精确测量,例如行星位置、化合物的原子量、光速。这些测量本身并不新奇,但提高精确性是规范扩展的必要工作。

使事实与理论相符。规范的预测和观测之间常有差距,理论的数学形式与实际现象之间也需要桥接。这类工作需要大量实验和理论技巧,用来消除偏差,或证明偏差是系统误差。

阐释规范本身。规范提供的是一套模型,但它能适用的范围需要逐步扩展。科学家要把规范的原理应用到新的领域,需要大量阐释工作。

常规科学的关键性质是:研究者预期某个结果,失败责任归于研究者本人,规范本身得到保护。如果实验结果与预期不符,标准反应是"仪器有问题"或"实验设计有缺陷",很少是"理论有问题"。

常规科学的难题特征

库恩把常规科学问题称为"难题"(puzzles),以区别于"重大问题"。难题的定义性特征是:它有一个确定的解,解的形式也大体预先可知,缺少的只是达到那个解的技巧。纵横字谜和拼板游戏就是这类结构的非科学例子。

把常规科学理解为解难题,解释了几件重要的事:

其一,规范把科学家的注意力集中到一个窄域中。那些暂时解不了的问题——例如十七世纪的医学问题、燃烧的化学机制——被暂时排除在"科学"范围之外,归入"时机未到"或"属于另一学科"。这种集中是常规科学推进快速的原因,代价是视野收窄。

其二,解难题对科学家有持续的吸引力,并不依赖结果是否意外。库仑的平方反比定律在他测量之前已有人预测,但完成精确测量仍然是一项有难度的工作,需要设计新仪器、精确控制条件。难题的挑战在于过程,不在于结论的新颖性。

其三,一个规范实际上承诺了解的存在。科学家接受规范,就接受了"这类问题在规范的框架内是可解的"这一预设。他们愿意花几年时间攻克一个问题,部分依赖这个预设。

规范:共识的结构

"规范"(paradigm)是本书最重要的概念,也是被误解最多的。库恩在书中承认这个词他用得宽泛,但他具体所指的是范例性解答(exemplars)——具体的解题样本,抽象的理论原则退居其次。

科学家的训练方式说明了这一点。学生学习物理学,主要通过求解教科书中的习题:伽利略落体、牛顿的摆、简单谐振子。他们反复求解这些模型,逐渐掌握"什么样的问题用什么样的方法处理"。这种学习的结果是一种模式识别能力,而非对一组显式规则的记忆。

规范并不以一套明文规则的形式存在。科学家通常无法完整列出他们所遵循的方法论规则,就像熟练的骑自行车者无法完整描述平衡的力学机制。如果把规范拆解为一套抽象原则,就会发现同一套原则的支持者之间也存在大量不一致——他们在应用上共享的远比在言辞上共识的多。

规范有以下几个操作性功能:

定义合法问题的边界。规范决定哪些问题值得研究,哪些问题暂时被排出科学范围。亚里士多德力学下,"一块石头为什么会掉落"是一个有意义的问题(它寻求形式因);牛顿力学下,这个问题被改写为"石头以什么加速度掉落",而"为什么有引力"则被视为超出物理学范围的形而上学问题。

规定可接受的解的形式。同一组实验数据,在不同规范下对应不同的"正确答案"。燃素论科学家面对金属煅烧,把增重解释为燃素的失去(假设燃素有负质量);拉瓦锡把同样的数据解释为氧气的吸收。这两套解释在各自的框架内都是逻辑一致的,差别在于规范预先规定了解释的形式。

为仪器设计和实验程序提供标准。库仑设计扭秤测量电荷间引力,前提是他接受了平方反比定律作为待验证的预期,这个预期指导了仪器的设计选择。没有规范,就没有确定实验是否成功的标准。

反常与危机

反常的出现

任何规范下都持续产生与预期不符的结果,这些结果被称为"反常"(anomaly)。大多数反常被以三种方式处置:

一是暂时搁置。承认观测结果有问题,但预期未来技术进步后可以解决。牛顿的万有引力方程预测月球近地点进动,但计算值与观测值长期不符,天文学家把差距记录下来,等待更精确的数据或更好的计算方法,引力理论的核心地位保持不变,直到更好的解释出现。

二是辅助假设修补。在主理论外加入辅助假设,使预测与观测重新相符。托勒密天文学通过不断增加"本轮"(epicycles)来应对行星运动的观测偏差,而不修改基本框架。

三是问题重新定义。把无法解决的反常归入"条件不成熟"或"属于另一领域"的范畴,暂时忽略它。

因此,孤立的反常不足以动摇规范。历史上没有哪个重要规范是因为单一的决定性反例而被放弃的。

危机的条件

当反常具备以下特征时,才会演变为危机:

反常触及规范的核心承诺,仅仅周边问题遇到困难还不足以触发危机。哥白尼之前,托勒密天文学的核心问题是历法计算——确定节日日期和预测天象。当天文学家发现历法误差积累到无法用本轮修补的程度时,这个核心问题失败了,危机才出现。

反常经过多人多次尝试仍无法被规范工具解决。燃素论在解释金属煅烧的重量变化时,多种辅助假设被相继引入(包括燃素有负质量),但这些补丁彼此矛盾,也不能统一解释所有金属的行为,危机逐渐积累。

危机的标志是弥漫性的不确定,科学活动开始松散:从业者开始公开讨论基本原则,研究方法的多样性增加,替代理论零散出现。库恩指出,危机期间的科学活动开始像前规范时期:各种不完整的替代框架并存,没有一个能解决所有问题。

科学革命

新规范如何出现

新规范的出现有自己的条件:它无法通过旧规范内部的逻辑累积得到,也无法通过不断添加辅助假设拼凑出来。新规范通常由学科外围或年轻一代的科学家提出,他们对旧规范的投入较少,更容易放弃旧框架。

哥白尼在提出日心说时,日心说并不比地心说更精确,也不更简单(哥白尼的系统同样使用本轮)。哥白尼的理论在最初几十年里被接受,部分原因是它提供了一种不同类型的整体性:行星运动的顺序和距离可以从系统的几何关系中推导出来,而在托勒密系统中这些都是独立的参数。这是一种解释整体性上的优势,精度上并无领先。

新规范的接受过程有两个层面:

解决旧规范的最严重问题。爱因斯坦的相对论解决了牛顿力学框架内无法处理的两类问题:高速运动的力学和麦克斯韦电磁方程与伽利略变换的不相容。这是接受新规范的必要条件,但一个解决了旧难题的理论还需要更多才能赢得广泛接受。

提供新的问题域,显示出更广泛的研究前景。一个能解决旧难题但没有开辟新领域的理论,对科学家的吸引力有限。新规范要取得胜利,需要既能处理旧问题,又能看到新问题。

革命的知觉结构:格式塔转换

库恩引用格式塔心理学的实验来说明科学革命的知觉结构。在一个著名实验中,受试者先看到"鸭子"图形,然后在不改变图像的情况下突然"看到"了"兔子"——两个感知状态之间没有中间状态,切换是整体性的、瞬时的。

科学家在革命期间经历的是类似的转变:在亚里士多德框架下,一个摆动的物体是一块"费力地下落到自然静止位置的重物";在伽利略框架下,同样的运动是"一个摆,以等时间间隔反复通过同一路径"。这两种描述属于不同事物的感知,分别隶属不同的概念框架,不能归约为对同一对象的不同测量精度——伽利略"看到"的摆是亚里士多德物理学中不存在的概念。

电学史提供了另一个例子:在富兰克林之前的电学家"看到"的是带电体对轻小物体的吸引;富兰克林规范确立之后,电学家"看到"的是两种电荷之间的吸引与排斥,静电排斥成为主要现象,而非之前的附带现象。观察条件没有改变,但被观察到什么改变了。

不可通约性

两个相互竞争的规范之间,库恩称存在"不可通约性"(incommensurability)。这个词来自数学:正方形的边和对角线是不可通约的,没有共同的度量单位。

不可通约性体现在三个方面:

问题集合不同。每个规范规定哪些问题值得解决。旧规范认为重要的问题,在新规范下可能不再是一个有意义的问题;新规范提出的问题,在旧规范下根本无法表述。牛顿力学搁置"引力的原因是什么"(归入形而上学),亚里士多德力学把这视为核心问题。因此,用牛顿标准衡量亚里士多德力学,会得出"亚里士多德没有研究力学的基本问题"的结论,但这个评价用的是后来的标准。

概念含义不同。相同的词在不同规范中有不同的含义。牛顿力学和爱因斯坦力学都使用"质量"这个词,但牛顿的"质量"是绝对的、与运动无关的量;相对论的"质量"依赖参考系,高速运动时会增加。这是概念含义的替换,精度修正的说法低估了变化的程度。当爱因斯坦的"质量"应用于日常低速情境时,它的数值与牛顿质量近似相等,但这种近似并不意味着两个概念相同。

方法论标准不同。规范决定什么样的解是好解,什么样的解是坏解。燃素论科学家用"燃素的释放量"来评价一个化学反应解释的好坏;拉瓦锡的规范用"氧气的转移量"来评价。双方面对同一组实验数据,用不同的标准判断哪个理论更好。这类分歧的性质超出了共同逻辑规则的调解范围,因为分歧本身就包含对什么算作好证据的不同假设。

不可通约性的实践含义是:两个规范之间的选择,不能完全依赖共同认可的逻辑规则来裁定。支持者必须依赖说服,有时还要依赖时间——旧规范的坚持者逐渐退出学术界,新规范的支持者接管教育和研究机构。

革命的不可见性

科学革命之后,教科书被改写。新教科书把科学史叙述为向当前规范的线性积累:每一代科学家都在为当前的理论添砖加瓦,革命只是"进一步完善"。这种叙述方式有其功能——它向新科学家传达当前规范的稳定性——但代价是抹去了革命的实际性质。

具体机制是:新规范的教科书在讨论历史时,用当前概念重新解释历史成果。牛顿被叙述为"在万有引力方向上做出贡献的科学家",而他在当时其实提出了一个极具争议的力学框架,同时代人对"超距作用"的神秘性质争论激烈。燃素论科学家普里斯特利(Priestley)在发现氧气方面的工作被纳入氧气化学的历史,尽管普里斯特利本人至死坚持燃素论,他认为自己发现的是"去燃素空气"。

科学家从这种改写中获得的效益是:他们可以把注意力完全放在当前规范内的工作上,不需要追溯各种历史选择和论争。代价是,科学家群体对自身知识产生方式的认识,与实际历史过程之间存在系统性偏差。

进步的方向:远离先前不足

库恩明确拒绝了这样一种图景:科学通过革命逐步接近对自然的真实描述,每次革命都是向终极真理的一步。他指出,这种图景无法得到辩护,因为我们没有独立于任何规范的视角来衡量"接近真理的程度"。

库恩的替代描述是:科学进步的方向可以描述为远离先前不足,但没有可以独立判断的终点目标。每次革命之后,新规范能解决更多的问题,能更精确地处理一些旧规范已经在处理的问题,能开辟新的研究领域。但"更多"和"更精确"是在新规范的问题集合内部衡量的,而新规范有时放弃了旧规范的某些问题。

这个论点的含义是进化生物学式的:物种的演化方向由具体的环境压力决定,事后才可描述,没有预设的完美形态在先。科学理论的演化类似:每次革命都是对持续积累的研究压力(反常和危机)的适应,方向只能事后描述,事前无从预判。

科学进步的实际机制

尽管如此,科学为什么比其他知识活动积累得更快、更彻底?库恩的回答是:科学社群的组织方式。

科学家通过规范的训练,形成一个具有高度共识的共同体。这个共同体能够把讨论集中在具体的、有确定答案的问题上,避免了反复纠缠基本原则。这种集中使工作效率远高于缺乏共识的前规范时期,也远高于那些持续讨论基本原则的学科。

但这种组织方式依赖于对质疑的抑制。正常工作期间,对规范正当性的质疑被当作不务正业。这种抑制有时确实阻止了有价值的修订;更多时候,它使精力集中到可以解决的问题上,加快了在该规范内部的知识增长速度。

几个可操作的推论

以下几点是从书中的历史分析中可以直接提取的、适用于思考其他领域的判断:

反常被察觉的概率,依赖预期的明确程度。科学家之所以能发现反常,是因为规范提供了明确的预期。预期越精确,偏差就越容易被识别。没有规范的数据搜集,产生的结果只是"事实","反常"需要一个预先存在的规范预期才能被辨认。一个领域越是缺乏明确框架,其从业者就越难以区分"重要的异常"和"无意义的噪音"。

新规范的早期倡导者常常处于外围。库恩观察到,最早认真对待新规范的往往是年轻科学家,或来自邻近学科的人。其机制有结构性原因:在旧规范下投入越多,认知重构的代价越大,对旧框架越熟练,用新框架看待数据就越费力。

一个问题如果持续解不出来,值得检查问题本身的预设。常规科学的默认态度是"解不出来是我的问题"。但当一类问题被多个能力不同的人长期无法推进时,应当检查问题是否定义在错误的框架内。燃素论化学家花了大量精力解释为什么金属煅烧后重量增加,但在燃素论框架内,这个问题本身的设置就不允许有令人满意的答案。

辅助假设的增多是框架承压的指标。当一个解释框架需要越来越多的辅助假设才能与观测相符时,这本身是框架遇到困难的信号。每次增加辅助假设,框架就变得更复杂、预测能力变得更差(因为自由参数增加了),同时降低了被证伪的可能性。这种趋势可以作为早期预警,但常规科学的惯性会让研究者持续添加假设,压力积累得足够大时才会触发真正的反思。

对手之间的争论往往是框架之争,而非证据之争。在危机期间,科学家之间的争论常常陷入"各说各话"的状态。这是因为双方判断证据好坏的标准不同,即使面对同样的实验,得出的结论也不同。当争论中反复出现"你的问题提错了"或"这个问题无意义"之类的回应时,往往意味着争论双方采用了不同的框架——分歧来自问题如何设置,不来自证据的多寡。