BOOK NOTES
随机漫步的傻瓜
纳西姆·尼古拉斯·塔勒布
塔勒布是职业期权交易员,同时受过统计学和哲学训练。这本书的核心问题来自他在金融市场的直接观察:为什么赚了大钱的人,几乎无一例外地把成功归因于自己的能力,而把失败归因于外部偶然?他想弄清楚这种认知偏差是怎么发生的,代价有多高,以及有没有减少伤害的方法。
书分三篇。第一篇讨论稀有事件(他称之为"黑天鹅")与归纳逻辑的问题:人系统性地低估极端事件的概率,是因为依赖有限的已知历史做外推,而这段历史恰好没有包含那些极端事件。第二篇讨论存活者偏差:我们只看到市场上还活着的人,不见已炸毁的那批,因此对绩效记录的解读几乎必然夸大技能、低估运气。第三篇讨论在随机性面前该如何行事,落点在行为策略和认知管理,消除随机性本身不在这本书的讨论范围内。
全书写法是散文式的,作者在历史、哲学、科学和市场之间来回穿插,借几位虚构的交易员(塔利波、约翰、卡洛斯)把抽象论点具体化。论证有时绕远,但核心框架相对清晰。
另类历史:评价决策的方法
塔勒布用"另类历史"(alternative histories)这个概念重新定义决策质量的评价标准。已发生的结果只是所有可能结果中的一条,评价一个决策,必须问这道结果在所有可能的情境下有多大比例会出现。
他用俄罗斯转盘举例:一把左轮手枪装1颗子弹,扣动扳机获得1000万美元。这个人赢了,但在6条可能的历史里有5条他仍然活着并拿到钱,只有1条他已经死了。我们只能观察到其中一条。问题在于,如果把同样的决策重复足够多次——或者有足够多的人做出同样的决策——那条致命的结果迟早会发生,而且是必然的。
相比之下,一位牙医靠30年手艺积累了同等金额的财富。假设他这辈子从头再来一百万次,可能出现的最坏结果也就是在差一点的城市执业,赚少一些。两个结果的金额相同,但在另类历史上的分布完全不同:牙医的财富在几乎所有情境下都在合理范围,转盘赢家的财富在大多数情境下根本不存在。
实践含义:评价一个策略或决策者,要追问"如果这个策略在无数条平行历史里运行,结果的分布是什么?",已发生的那一条只是全部可能结果中的一个样本。连续5年盈利的基金经理人,要知道有多少人以类似的方式操作、其中有多少炸毁了,才能判断那5年的记录有多少含金量。
黑天鹅:稀有事件为什么总被低估
休谟在《人性论》里提出归纳法的根本困难:看过多少只白天鹅都无法推出"所有天鹅都是白的",但只要看到一只黑天鹅,这个命题就被推翻。两个方向的不对称来自逻辑本身。
塔勒布把这个逻辑直接搬进市场分析。某类债券历史上从未违约,这条历史支持不了"它以后也不会违约"的结论——那是归纳陷阱。但一次违约可以让持有者亏掉历年盈利的数倍。这就是稀有事件的结构特征:正面结果逐步积累,负面结果单次爆发,两者的量级极不对称。
书里对照了两位交易员的职业轨迹。约翰持续持有高收益债券,用杠杆放大收益,7年为雇主赚了约2.5亿美元,32岁时个人财富约100万,到35岁时已达1600万。1998年市场结构改变,短短数天亏掉雇主6亿以上,个人财富几乎归零。塔利波始终设止损上限,每当损失到达预设门槛立即平仓,收益比约翰少,但职业生涯从未炸毁。
按另类历史计算,塔利波的情况优于约翰:在多数可能的情境下,他的财富处于合理范围;约翰的财富在多数情境下根本撑不到1998年。书里用"牙医远比摇滚明星富有"概括这个逻辑——牙医的另类历史分布集中,摇滚明星的分布极度两极,大多数情境下他们什么都没有。
偏态与期望值:频率不等于回报
塔勒布用一个数字例子说明问题:某场赌博,1000次里999次赚1美元,有1次赔10000美元。赢的频率是99.9%,但期望值约等于负9美元——每次下注平均亏损。频率高的选项期望值可以是负的。
这在直觉上很难接受,因为人的认知系统处理频率的能力远强于处理加权平均值的能力。在金融市场,一次极端损失可以超过此前所有积累,忽视期望值的不对称会导致系统性错误。
书里举了一个具体场景:某次会议上,有人请作者表态对股市后市"看涨还是看跌"。他的回答是:我有70%的概率认为市场下周会小幅上涨,同时我重仓做空。两件事并不矛盾,因为假如市场下跌,可能跌很多;假如上涨,只是小幅上涨。期望值使他偏向做空,即使他认为上涨概率更高。
实践含义:"看涨"或"看跌"这类判断缺乏可操作的信息,必须同时说清上行幅度、下行幅度以及各自的概率,才能推导出正确的操作方向。
噪声与信号:观察频率的影响
同一个投资策略,观察频率不同,看到的东西不同。设某策略年均超额报酬15%、年波动率10%:年度时间尺度上有约93%的概率盈利;秒级时间尺度上盈利概率只略高于50%,因为短期波动完全淹没了方向信息。
书里把这个问题量化了:年报酬15%、波动率10%的策略,在1小时的时间尺度上,每出现1次有意义的信号,就伴随约30次噪声;在1秒的时间尺度上,这个比值约为1:1796。频繁盯盘等于主动将自己暴露在高噪声环境下。
实验室心理学研究的结论是,损失体验的强度约是同等金额收益体验的2.5倍。假设某牙医每分钟查看账户,一天里他有241分钟愉快、239分钟痛苦,但痛苦更重,最终是情绪赤字。改成每年看一次,20年里约有19次愉快体验、1次不愉快。同一个策略,同一个人,情绪结果完全不同,原因只是观察频率。
高频信息的另一个代价是决策质量下降:噪声持续刺激情绪,人容易在噪声触发的状态下做出错误操作,而真正有意义的信号却在噪声中难以辨认。
归纳法与波普尔:如何对待过去的数据
休谟之后,波普尔给出了一个处理归纳问题的操作框架。波普尔认为理论无法被验证,只能被证伪。一个好的理论必须说明"什么条件下这个理论是错的";凡是没有可证伪条件的陈述,就脱离了科学的范畴,属于占星术级别的断言。
对交易员的直接含义:进场之前必须明确"什么信号会让我认错、改变立场"。卡洛斯(书中新兴市场交易员)的问题是,他的操作逻辑从未预设过"哪种情况证明我错了"——他相信自己的经济学分析,市场越跌越买,最终在1998年俄罗斯违约时将个人一半财富打进了垃圾价。他没有准备好接受证伪。
索罗斯的做法被塔勒布作为反面的对照:索罗斯可以在极短时间内完全反转立场,不以维护一贯性为目标。书里有一个逸事:索罗斯在打网球时对市场持明确空头立场,几天后市场暴涨,再见面时索罗斯说自己已回补了空头,并建了很大的多头头寸。他之所以有这种灵活性,是因为他不把自己的判断视为身份认同的一部分,每一天都可以从头开始。
波普尔框架的实践应用:用历史数据和统计工具积极下注,但不用它们管理承受的风险上限。在已知的证据里寻找机会,同时要保证稀有事件发生时,损失在可承受的上限之内——依赖"稀有事件不会发生"这个假设来运作,是归纳法陷阱的直接应用。
存活者偏差:只看赢家的代价
假设1万名交易员,每年盈亏概率各半,亏损者被淘汰。连续5年运行后,仍在场的约313人全部有5年连续盈利记录。这313人里没有任何人有特殊技能——他们的成功完全靠运气。市场观察者只看到这313人,不见那9000多已离场的人。
如果换成能力更差的群体,45%胜率,同样操作5年,最后仍有约184人连续盈利。这些人会成为明星经理人,在媒体上露面,接受采访,并吸引新的资金。
书里指出:样本越大,靠运气出现的极端表现者就越多。因此评估任何绩效记录,必须知道原始群体的大小——1万人里的5年全胜和10人里的5年全胜,含义完全不同。缺少这个信息,绩效记录几乎没有判断价值。
存活者偏差还有一个变体:书评封底上的推荐语,出版商只选最好的那条,而所有评价的中位数远低于此;网球赛广告期间播放的基金广告,只有表现最好的才有预算打广告;畅销书里讨论的有钱人都是赢家,同策略群体里的失败者没有现身的渠道。
数据挖掘:用历史找规则的陷阱
历史回测程序让用户在大量历史数据里搜索能带来盈利的操作规则。问题在于:尝试的规则越多,找到一条"历史上有效"的规则的概率越高,但这条规则越有可能只是拟合了噪声,未来无效。
这和生日悖论类似:23个人中有约50%的概率存在两人同天生日,但这不意味着任何两个特定的人同天生日有多大意义——只要房间里的人够多,总会有某对人碰巧相同。数据越多,随机序列里出现某种"规律"的概率越高,因为规律并不需要预先指定。
书里援引学术研究(Sullivan、Timmerman、White)说明:市场上长期流行的技术分析规则,其历史有效性有相当比例可能只是大量尝试后的幸运者效应。真正有预测力的规则和靠运气存活的规则,在历史回测里外表完全一样。
卢卡斯批判给这个问题加了一层:即使真的发现了某种有效的统计规律,理性的市场参与者一旦发现并利用它,规律本身就会消失——因为大家提前行动,规律被消除了。历史数据挖掘的基础是过去的行为模式,但过去的模式是在特定机构结构和参与者组成下产生的,今天的结构已经改变。
非线性与赢家通吃
沙堆效应说明非线性的结构:持续往沙堆顶部加沙,沙堆稳定地增高;直到某一粒沙触发整体崩塌。这粒沙和之前每一粒沙没有区别,但它造成了不成比例的结果。这是非线性的基本特征:输入是线性累积的,输出是突变的。
在市场和职业里,非线性的另一种形式是路径依赖。QWERTY键盘的字母排列最初是为了防止机械打字机卡键,这个理由消失几十年后,键盘排列依然存在。原因是用户已经学会了这个布局,切换成本超过了潜在的效率提升。早期的随机因素锁定了后来的结构。
经济学家阿瑟(Brian Arthur)的波利亚过程模型说明了正向反馈怎样放大初始优势:每次成功提高后续成功的概率,早期的微小差异在足够多轮次后会变成巨大的分化。这个机制部分解释了为什么表现稍好的人能获得大得多的报酬——正向反馈把初始的小差异放大了,能力差距在这个过程中只占很小的权重。
关联含义:在高路径依赖的行业里,判断某人成功有多少来自能力、多少来自早期的随机因素,比在低路径依赖的行业里更难。过去的绩效对未来的预测力也因此更低。
认知偏差的生物学根源
卡尼曼和特沃斯基的研究发现,人对概率的处理存在先天限制。塔勒布把这些发现放在进化背景下解释:
人每次只能清晰想象一种状态,脑子里保持不了概率加权的混合图像。实际决策时,人倾向于把"最可能的结果"当作期望值来行动,忽略低概率高影响的极端情境。
人对损失的敏感度高于同等金额的收益,行为经济学估计比率约为2.5:1。具体后果是:频繁观察亏损对情绪造成的伤害,无法靠同等频率的盈利来补偿,长期下来情绪账户是负数。
人从小样本里过度外推,容易把短期相关性误读为因果关系。斯金纳的鸽子实验演示了这个机制:随机投食的鸽子,发展出了复杂的"祈雨舞"式仪式,相信某种特定动作与食物出现有因果关系。这是神经系统对相关性的天然反应,在稀疏信息环境下是有效的,在高噪声环境下会产生大量错误联结。
医学测试题的例子(书里引自 Deborah Bennett 的研究):某疾病人群患病率为千分之一,检测误报率5%。随机检测某人呈阳性,实际患病概率约为2%。大多数医生给出的答案是95%——把检测准确率直接当成患病概率,混淆了条件概率和无条件概率。这个错误的根源是人处理联合概率的直觉机制本身,与粗心无关。
塔勒布的结论:了解这些偏差,并不能靠意志力克服它们,因为偏差根植于生理结构,增加知识解决不了这个问题。正确方式是设计避开即时判断的机制——把决策规则写在情绪稳定的时候,强制执行。
行为策略:用规则替代临场判断
奥德修斯把自己绑在桅杆上,提前解除了在女妖歌声面前即兴决策的权力。这是塔勒布在第三篇里一直引用的比喻。
他自己采用的几个操作方法:
止损:预先确定在什么条件下出场,不依赖临场判断。亏损到达预设门槛,机械平仓。原因是临场判断会被损失厌恶、确认偏差和路径依赖污染,导致系统性地"再等等看"直到损失无可挽回。
控制信息输入频率:不看日报商业版,不在交易时间盯盘。每秒更新的价格信息对长期策略几乎只有噪声没有信号(前面给出的比值是1796:1);每周或每月查看一次,噪声比例大幅下降,情绪干扰大幅减少。
以另类历史评估:对任何一个策略,问"如果这个决策重复一百万次,结果的分布是什么?",把已发生的那一条视为全部可能结果中的一个样本,而非代表性结论。
预设可证伪条件:对每个操作立场,事先明确"什么情况会让我认错并出场",防止判断滑向无法动摇的信念。卡洛斯失败的根本原因之一是他的分析里从未设定过"哪种情况证明我错了"。
减少社会比较的暴露:塔利波在同公寓楼的华尔街交易员面前感到压力,因为他的比较基准被高度筛选的群体替代了。书里建议:如果参照群体是存活者偏差产生的,那个压力本身就建立在错误的信息上,转移参照群体比试图忽略压力更有效。
斯多噶主义:有尊严地面对随机性
书的第三篇末尾从行为策略转向更个人的层面:在随机性面前,什么行为方式是有价值的?
塔勒布援引斯多噶哲学的核心立场:人能控制的只有自己的行为,结果受随机性支配。因此评价一个人,行为的合理性是可靠标准,结果的好坏受随机性左右,用结果倒推决策质量会产生系统性偏差。
卡瓦菲的诗《神抛弃安东尼》在书末被引用:安东尼在战败后失去了一切庇护,包括一直保佑他的神。诗人建议他向城市告别,不必哀求怨叹,情感震颤时倾听,坚定不为所动。塔勒布引这首诗,意思是:有情绪本身没问题,但行为仍须有尊严。
几个具体的场景:赔钱时对助手更客气,抑制发泄冲动;做操作决策时按预先规定的规则行动,避开情绪状态下的临场判断;收到坏消息时,先找专业人士讨论应对方案,把情绪限制在私人空间里。这些行为未必能改变结果,但减少了随机性对决策过程本身的干扰。
斯多噶的论点有一个限制:它在要求高度自律方面,和理性主义者"了解偏差就能克服偏差"的错误一样,都把意志力的作用高估了。塔勒布自己承认,书写完之后卡瓦菲在临死前并没有表现出诗里描述的尊严——他紧抓着探病者不让走,大哭大叫。这个细节说明斯多噶理想作为个人实践标准是很高的,但作为思维框架仍然有用。
核心概念
另类历史(alternative histories):评价决策时考虑全部可能路径,已实现的那条只是其中的一个样本。赢家不等于做了好决策,判断标准是他的结果在多大比例的可能情境下都会出现。
黑天鹅(black swan):稀有的、影响巨大的事件。其概率被低估,原因是人从有限的近期历史推断,而这段历史恰好没有包含此类事件。黑天鹅的定义是:从已知数据无法合理预期,但确实会发生,发生时影响远超此前任何积累。"不可能发生"是人们对它的错误标签,准确描述是"在已知历史中没有出现"。
偏态(skewness):结果分布不对称,上行和下行的量级不同。高频率盈利加低频率巨额亏损的策略,期望值可以是负的。频率和期望值必须分开考虑。
存活者偏差(survivorship bias):样本被正向筛选,只包含还在市场中活动的参与者,不含已炸毁的。高估了策略和能力的有效性。
归纳法问题(problem of induction):历史数据无法保证未来。看过多少白天鹅都推导不出"没有黑天鹅",但一只黑天鹅就推翻了这个结论。这个不对称性在知识论上有根本意义。
数据挖掘(data mining / overfitting):在历史数据里搜索有效规则,尝试次数越多,筛出一条"历史上有效"的规则的概率越高,但大多是拟合噪声。真正有预测力的规则与靠运气存活的规则,在历史回测里外表相同。
期望值 vs 频率(expected value vs frequency):期望值等于各种结果的概率加权平均,等于高频率低收益加上低频率高损失的综合。频率高的选项期望值可以是负的。
波利亚过程(Polya process):先前的成功提高后续成功的概率,形成路径依赖。早期的微小随机差异在足够多轮次后会放大为巨大的最终分化,与初始能力差距无必然关系。
可证伪性(falsifiability):一个判断或策略,必须能说清楚"什么情况下它是错的"。没有这个条件,它就无法被检验,也无法指导行动。
可迁移的判断原则
评估绩效记录需要知道原始群体大小:5年连续盈利在1万人的群体里靠运气就能产生约313人;在10人的群体里,同样的记录含金量完全不同。缺少这个信息,绩效记录几乎无法区分运气和能力。
频率高的选项要单独计算期望值:下注前算清楚上行空间和下行空间的比值,以及各自的概率。单看频率会系统性地低估低概率高影响的极端损失。
止损条件必须在入场前设定:临场判断会被损失厌恶和路径依赖污染。预先明确"亏损到什么程度我就出场"并机械执行,效果好于"我会在应该出场时出场"的自我承诺。
减少信息接触频率:对长期判断有价值的信息,以周或月为单位更新。每天、每小时更新的价格信息对长期策略几乎只有噪声,频繁接触会增加情绪波动和错误决策的频率。
为每个判断预设可证伪条件:任何操作立场,事先明确"什么情况证明我错了",防止判断演变为无法动摇的信念。没有这个条件,亏损时会自动触发辩护模式——寻找理由继续持有,检讨判断本身是否有误这件事就很难发生。
环境改变后,策略的有效性需要重新评估:某段时期有效的策略,可能刚好契合那段时期的市场结构。1992—1998年间逢低买入新兴市场债券有效,是因为那段时间市场结构支持这个做法;1998年之后,同样的做法变成了最大的风险来源。检验策略有效的条件,比检验策略有效性本身更重要。
参照群体的选择影响自我评价的准确性:马克律师在公园大道的高度筛选邻居面前感觉失败,但在全美收入分布上属于前0.5%。压力本身没有错,但如果参照群体是存活者偏差的产物,那个比较的基准就是扭曲的。