BOOK NOTES

错误的行为

Name: 错误的行为
Author: 理查德·塞勒

理查德·塞勒

塞勒写这本书的方式很特别：他把行为经济学的发展史写成了自己的职业回忆录。从1970年代在罗切斯特大学读博士开始，他在办公室黑板上列了一张清单，记录身边那些与主流经济学预测不符的行为——冒着暴风雪去看买了票的球赛、不愿花10美元雇人剪草坪却拒绝以20美元帮邻居剪、礼物只有当作礼物送出去才让人高兴。这张清单后来成为整个学科的起点。

书的主线有两条：一是从心理学中发掘工具，解释为什么人们系统性地偏离"理性经济人"的行为；二是克服主流经济学界的抵制，把这套工具变成一个严肃的研究领域，并最终用于公共政策。

标准模型的前提与它的问题

传统经济学建立在一个核心假设上：人们在给定约束下追求效用最大化，预测是无偏的，偏好是稳定且可传递的。用塞勒的公式：约束最优化 + 均衡 = 经济学。

这个框架的力量在于简洁：它从几条公理推导出大量可验证的预测，让经济学在社会科学中拥有最高的理论一致性。问题是，它描述的不是真实的人。

塞勒用一个考试例子开篇：他把期中考试满分设为137分而非100分，学生的心情明显更好，尽管换算成百分制得分完全一样。对理性经济人来说，分母是什么和他们的等级无关；对真实的学生来说，96分比72分就是高兴。这类"看似无关的因素"（SIFs，seemingly irrelevant factors）——按照理论不应该影响决策却实际上影响了决策的变量——是整本书追踪的对象。

前景理论与价值函数

塞勒在1977年读到卡尼曼和特沃斯基的论文"不确定性下的判断：启发法和偏见"，随后又拿到了"前景理论"的初稿，这两篇文章给了他一个系统化的框架，把黑板上那些零散案例组织起来。

前景理论的核心是S型价值函数，与传统的财富效用函数有三点不同：

1. 参照点。人们对得失的感知以某个参照点的变化量为基准，财富的绝对水平不直接起作用。发现年终奖是5000元，人们的反应是感受到"多了5000元"，而不是把这笔钱加进毕生财富的总账里做加减法。同样金额出现在不同的参照点，带来的效用可以截然不同。

2. 损失厌恶。损失带来的痛苦大约是等量收益带来的快乐的两倍。卡尼曼和特沃斯基的实验数据是2.5倍，实践中通常用2倍作为近似值。这解释了为什么罗塞特教授愿意喝掉一瓶当年10美元、现在市价100美元的藏酒，却绝不愿意花100美元买一瓶同样的酒来喝——持有这瓶酒感觉是得到100美元，卖掉再买则感觉是花掉100美元，两种账面操作对情绪的影响完全不对称。

3. 敏感性递减。不管是收益还是损失，随金额增大，边际感受递减。损失10美元和20美元之间的差别，远大于损失1310美元和1320美元之间的差别。这解释了为什么在已经损失100美元的情况下，人们更愿意赌一把以求翻本——额外损失100美元和不损失之间的痛苦差距，比什么都没损失时要小。

价值函数让塞勒重新理解了他的行为清单：那些"非理性"案例呈现出系统性偏差的模式，根植于人类处理得失的基本心理结构，并非随机分布的奇怪行为。

禀赋效应：买价与卖价的不对称

塞勒在博士论文阶段注意到一个调查结果：愿意支付多少钱以消除某一死亡风险（A情境）和要求多少钱才愿意承受同等死亡风险（B情境），两种问法的答案相差极大，后者往往是前者的数十甚至数百倍。经典经济学认为这两个问题在逻辑上等价，但受访者显然不这样感受。

这个不对称性后来被他命名为禀赋效应：人们对已经拥有的东西的估值，高于对同样东西在未拥有时的估值。失去某物的痛苦大于得到它的快乐，所以卖家要价总是高于买家愿意支付的价格。

1985年回到康奈尔大学后，塞勒设计了马克杯实验来验证这一效应。实验中，一半学生随机获得印有学校标志的马克杯，然后开放交易。如果市场有效，喜欢马克杯的人（不管最初是否持有）将最终持有杯子，约一半的杯子应该发生交易。实际上，四轮实验中每轮只成交约2笔（预期是11笔）。持有马克杯的学生要价中位数约为5.25美元，而没有马克杯的学生愿意支付的中位数约为2.25至2.75美元。同样的杯子，持有者的估值几乎是非持有者的两倍。

代币实验（使用可兑换现金的代币而非实物）的交易量符合理论预测，说明不是交易成本的问题——是拥有本身改变了估值。

禀赋效应对科斯定理构成挑战。科斯定理的核心预测是：在交易成本为零的情况下，权利的初始分配不影响资源的最终配置。但马克杯实验表明，即使没有交易成本，初始分配确实影响最终持有者，因为人们对自己拥有的东西的要价系统性地高于他们购买同样东西的出价。

心理账户：金钱的不可替代性

经济学的一个基础假设是金钱的可替代性：一美元就是一美元，不管它从哪里来、被放在哪个账户里。心理账户理论的核心发现是：真实的人不这样对待金钱。

获得效用与交易效用

塞勒区分了两类效用：获得效用（acquisition utility）是商品本身带来的价值减去机会成本；交易效用（transaction utility）是实际支付价格与"参考价格"（消费者期望应该支付的价格）之差带来的满足感或不适感。

沙滩买啤酒的实验说明了交易效用的作用：同样的啤酒，从高档度假酒店买愿意支付7.25美元，从破旧杂货店买只愿意支付4.10美元，区别在于期望价格不同，导致交易效用不同。啤酒本身的价值没变，影响支付意愿的是"这次交易划不划算"。

交易效用解释了很多消费行为：为什么彭尼公司放弃促销改用天天低价后销售额骤降（顾客失去了获得正向交易效用的来源）；为什么打折商品比同等降价更能刺激消费；为什么人们柜子里有很多从未穿过的衣服（当时只是因为"太划算了"）。

沉没成本效应

已经花出去的钱，在理性模型中应该对当前决策毫无影响——覆水难收，一律忽略。但普通人会追踪沉没成本并让它影响后续行为：买了票就要去看球赛，哪怕外面下着暴风雪；买了会员卡就要去健身，哪怕每次都很痛苦；买了便宜的不合脚的鞋还要继续穿。

沉没成本效应有一个有趣的时间衰减：阿克斯和布卢默的实验显示，以折扣价购买校园剧场年票的学生，在秋季学期比全价购买的学生看了更少的演出，但到春季学期两组的观看率趋于相同。支付的金额越高，影响越大；时间越长，影响越弱。

预算与心理账户的分箱

家庭和公司都会将支出分类管理，不同"账户"的钱并不完全可替代。2008年油价从每加仑4美元降到2美元，消费者购买高等级汽油的概率是理性经济人预测的14倍——省下来的钱留在了"汽油预算"账户里，更倾向于花在汽油相关的升级上，而不是随意分配到其他消费。

自我控制：计划者与行动者

吃饭前把腰果拿走，大家都很高兴。对理性经济人来说，这毫无道理——如果你不想多吃，不吃就行；如果你真的想多吃，拿走碗是损害了你的福利。塞勒意识到，这里存在一个经济学无法处理的真实冲突：一个有长远眼光的"计划者"，和一个只管当下的"行动者"，二者都在同一个人身上。

双曲贴现与现时偏见

萨缪尔森1937年建立的贴现效用模型假设人们以固定的指数函数对未来进行贴现——今天比明天好10%，明天比后天也好10%。但实际观测到的是"双曲贴现"（或称现时偏见）：人们对"现在"和"稍后"的贴现率极高，但对"较远的将来"中两个时间点之间的贴现率则接近于零。

用具体例子：如果问你要今天的100元还是明天的110元，你可能选今天；但如果问你要365天后的100元还是366天后的110元，你几乎必然选366天后。同样是等待一天，在"现在"和"将来"面前的感受截然不同。这导致人们会事先做出承诺却事后反悔，制定计划却不执行。

承诺策略与规则

解决自我控制问题的有效手段是奥德修斯式的承诺策略：提前约束自己，移除诱惑或提高反悔的成本。斯特罗茨选择把年薪分12个月发放而非9个月，以防暑假时没钱花；节食者不在冰箱里放冰激凌；学者预先答应在会议上展示论文以逼自己写完。

塞勒和谢弗林在此基础上建立了计划者–行动者模型，把自我控制问题形式化为一个组织内部的委托代理问题：计划者对行动者使用内疚（减少享受以降低行动者的意愿）或规则（提前设定边界限制选择）来约束行为。规则比内疚更高效——使用规则时，不合规的行动本身会带来负效用，不需要每次都用意志力抵抗。后来莱布森等人用β-δ模型提供了更简洁的数学表达，但核心机制是一样的。

公平：人们会花钱惩罚不公平

经济学的一个简洁预测是：在最后通牒博弈中，提议者会给响应者尽可能少的钱（比如50美分），响应者会接受，因为50美分总比0好。实验结果是：当提议者给出的比例低于总金额的20%时，多数响应者会拒绝。

卡尼曼、尼奇和塞勒的电话调查进一步量化了什么样的商业行为会被认为"不公平"：

暴风雪过后把雪铲价格从15美元涨到20美元：82%认为不公平
椰菜娃娃断货时拍卖最后一个存货：74%认为不公平，但若拍卖所得捐给慈善机构则79%认为可接受
汽车经销商在供不应求时把价格从低于标价200美元改回标价：42%认为不公平（而若是从标价再涨200美元，71%认为不公平）

框架效应在这里很重要：取消折扣比增加附加费在感知上更容易接受，即使最终价格完全相同。这解释了为什么聪明的定价策略应该把最高价设为"标价"，低价时用"折扣"描述，而不是用"附加费"描述高价。

惩罚博弈实验测量了人们惩罚不公平行为的意愿：81%的实验对象愿意放弃1美元，与一个公平分配者合作，而不与多给自己1美元的不公平分配者合作。人们会用真实的钱去惩罚陌生人的不公平行为，即使这对自己的利益没有好处。

对主流经济学的四个反驳

行为经济学在建立初期面临四类系统性质疑，塞勒在书中逐一回应：

"似乎"（as if）：弗里德曼式的辩护——即使人们不能真正解决最优化问题，他们的行为也"似乎"在这样做，就像职业台球手不懂物理方程却能打出符合物理的球路。塞勒的回应：这个类比只对专家有效。经济学的目标是建立对所有人有效的理论，针对专家的模型还不够。普通消费者购物、储蓄、择业时的表现，更接近业余台球手——经常瞄准最近的球，球也经常打不进洞。

"激励"：更高的激励会让人做出理性选择。格雷瑟和普洛特的实验发现，用真钱做偏好反转实验，反转的频率和强度实际上增加了，而非减少。《一掷千金》电视节目中，参赛者面对数十万欧元的决策时，仍然表现出前景理论预测的路径依赖和风险追求行为。

"学习"：在现实中，人们通过反复练习会学会做出理性选择。这个论点与激励论点相互矛盾——出租车司机每天都在做同样的决策，算是高学习机会，但其表现仍然偏离理性。更重要的是，最重要的决策（买房、选职业、退休规划）往往是一生只做一次的事情，根本没有学习机会。"宾默尔连续体"的结论是：学习机会越多的决策，往往利益越小；利益最大的决策，反而最少学习机会。

"市场"：即使个人行为非理性，竞争市场会淘汰这类行为。塞勒的回应是：市场残酷但不能使人理性。一个过于关注沉没成本的人会变胖，但市场不会纠正这个问题。过度自信的创业者要么成功，要么失败，但失败的原因多种多样，市场无法有效传递"你是因为过度自信才失败"的信息。通用汽车经营不善却存活了几十年。"看不见的挥舞的手"是一个声称市场会纠正一切非理性的万用借口，但没有具体机制支撑。

金融市场的行为现象

金融市场是行为经济学验证自身最有力的战场，因为这里有精确的理论预测（有效市场假说）和充足的数据。

股市的过度反应：塞勒和德邦特发现，过去5年表现最差的股票组合（"输家"），在随后5年的收益比大盘高出约30%；而过去5年表现最好的"赢家"组合，收益比大盘低约10%。这违反了有效市场假说——历史价格不应该能预测未来收益。他们的解释是投资者对近期好消息或坏消息过度反应，导致"赢家"被高估、"输家"被低估，随后出现均值回归。

价值股溢价：格雷厄姆早就发现低市盈率（"便宜"）的股票长期回报高于高市盈率（"昂贵"）的股票。按照资本资产定价模型，更高的回报意味着更高的风险；但实证上价值股的贝塔值通常低于成长股。法玛和弗伦奇后来承认了这一异常，但把它解释为尚未被识别的风险因子，而非定价错误。

短视型损失厌恶与股权溢价：历史上股票的年均回报率比债券高出约6%。如果投资者是理性的，仅凭风险不能解释这么大的溢价。塞勒和贝纳奇的解释：投资者查看账户的频率太高（大约一年一次），损失厌恶使他们每次看到小幅亏损都很痛苦，导致他们系统性地低配股票。实验验证了这一机制：让实验对象看一年期收益数据（波动频繁，看到的损失更多）比看30年累计收益数据时，配置到股票的比例低得多——同样的历史数据，展示方式不同，决策结果截然不同。

封闭式基金折价：封闭式基金通常以低于资产净值10%-20%的折价交易，违反一价定律。塞勒、李和施莱费尔的解释：个人投资者（持有封闭式基金的主要群体）有随时间波动的"投资者情绪"，折价率与他们的情绪状态同步——情绪乐观时折价收窄，悲观时折价扩大。封闭式基金折价的变化与小公司相对大公司股票的收益差高度相关，因为两者都受个人投资者情绪驱动。

3Com/Palm的负股价：2000年Palm上市后，3Com持有的Palm股份的市值超过了整个3Com公司的市值，意味着3Com的其他业务（持续盈利）的隐含价值为负。这明确违反了价格不能为负这一最基本的金融学原理。理性套利者应该买入3Com、卖空Palm，但实际上这种明显的套利机会持续了数月。原因：Palm的浮动股数量太少，足够多的套利者无法借到足够的Palm股票进行卖空，导致市场价格无法被套利行为纠正。

NFL选秀中的决策偏差

美国橄榄球联盟的选秀活动提供了一个验证行为偏差的绝佳实验室：利益真实（球员合同金额巨大）、数据完整（所有交易和薪酬可查）、且有明确的市场价格（选秀权交易数据）。

塞勒和马西发现，在实际的选秀权交易中，高顺位选秀权的交易价格远高于它实际产生的"剩余价值"（球员绩效价值减去薪酬成本）。在第一轮中，越靠前的选秀权产生的剩余价值越低，而非越高——球队为高顺位支付了溢价，但高顺位球员的薪酬远超其实际贡献。

造成这一偏差的机制：

过度自信：球探相信自己能够准确区分第1顺位和第5顺位的球员，但实际上相邻顺位球员中先被选中者更优秀的概率只有52%-56%，接近于猜硬币。
极端预测：赛前被看好的球员往往被描述成"潜在超级巨星"，预测过于乐观。
赢家的诅咒：多支球队竞争同一名球员时，出价最高的球队通常对该球员的估值也最高，即最倾向于高估其价值。
现时偏见：球队老板和教练希望马上赢球，用今年的选秀权换取次年更好的选秀权的交易极少发生，隐含贴现率高达136%。

这一结论同时检验了"贝克尔猜想"——竞争市场会选拔出能够做出最优决策的专业人士。现实是，即使在利益巨大、竞争激烈、有大量历史数据可供参考的环境下，球队决策仍然系统性地偏离最优化。

助推与自由主义的温和专制主义

2004年前后，塞勒和桑斯坦把行为经济学的研究成果转化为政策工具。核心洞察：由于人们存在可预测的行为偏差，政策的"选择架构"（choice architecture）——即如何呈现选项、设置默认值、安排选择顺序——会系统性地影响决策结果，即使没有禁止或强制任何选择。

"明天储蓄更多"计划是这一思路的代表作。塞勒针对退休金储蓄不足这一问题，识别出三个行为障碍：惯性（不想改变现状）、损失厌恶（不愿看到当前薪水减少）、现时偏见（总觉得"以后再多存"）。

他设计的计划同时对付这三个障碍：让员工现在承诺在下次涨薪时提高储蓄率，而且以后每次涨薪自动继续提高，直到达到上限（员工可以随时选择退出）。这样：现时偏见被绕过（承诺的是未来行为）、损失厌恶被减弱（绝对薪水不降低，只是涨幅的一部分转为储蓄）、惯性被利用（一旦加入，不行动就是继续增加储蓄率）。第一次实施该计划的公司员工储蓄率在三年半内从3.5%上升到13.6%。

**自动加入（Auto-enrollment）**是另一个典型例子。把加入401(k)退休金计划从"需主动申请"改为"默认加入，可选择退出"，一家公司的参与率从49%升至86%。按经济学的标准框架，默认选项是看似无关的因素，因为真正关心储蓄的人不会因为要填几张表格而放弃免税优惠；按行为经济学，惯性和现状偏见使默认选项成为极有力的政策工具。切蒂等人用丹麦税务数据的后续研究发现，在新增储蓄中，99%来自默认选项设计，1%来自税收优惠政策。

助推与强制的区别在于：助推不删除选项，不强加成本，不要求合规，只改变选项的呈现方式和默认状态。小便池里刻的苍蝇图案减少了80%的溅出，没有任何人被强制做任何事。税务催款信里加一句"你所在地区的绝大多数人都已及时缴税"，在23天内多收了900万英镑的税款，成本几乎为零。英国行为洞察力小组（"助推小组"）2010年成立后系统性地把这类方法应用于政策实施，并要求所有干预措施通过随机对照实验验证效果。

可迁移的判断工具

买价/卖价不对称：在任何涉及转让或交换的谈判中，持有方的心理底线与非持有方的意愿出价之间存在系统性差距。这个差距来自禀赋效应，与信息不对称或谈判技巧无关。

框架效应的实用推论：把同一结果描述为"取消折扣"比"增收附加费"引发的抵制小得多。把高价设为标价、低价用"折扣"描述，比把低价设为标价、高价用"附加费"描述，消费者反应更温和。

默认选项的力量：任何需要大量人群参与的选项设计，默认值的选择比宣传和教育更有效。自动加入、自动升级、提前设置的规则，都利用了惯性与现状偏见，把"不行动"变成一种有意义的政策工具。

现时偏见的应用：要让人们做他们知道对自己有益但当下不愿意做的事，最有效的方式是让他们针对未来行为提前承诺——"现在决定以后做什么"的阻力远小于"现在就做"。

损失厌恶的非对称设计：以损失为参照点的激励（先给奖金、表现未达标则退还）比事后奖励更有效，因为退还已经到手的钱比失去潜在收益更令人不快。

用行为障碍而非动机解释不作为：人们没有做某件事，背后往往存在某个微小但真实的摩擦——阁楼太乱不好安装隔热层，表格太复杂懒得填。这类摩擦在主观上感觉微不足道，却足以阻止行动。移除摩擦往往比提高激励更有效。

方法论的立场

塞勒在书中反复强调一个区分：规范性理论（告诉我们应该怎么做）和描述性理论（告诉我们实际怎么做）是不同的任务。传统经济学把两者合并——理性选择公理既是规范，也被当作描述。行为经济学的工作是建立准确的描述性模型，而不是取代规范性标准。损失厌恶是真实存在的心理机制，不是说人们不应该避免沉没成本陷阱；前景理论描述人们实际如何在风险下选择，不是在主张这是最优决策方式。

他也明确说，没有哪个行为经济学发现意味着传统经济学应该被抛弃。理性模型是研究的起点：正是因为有了理性模型的精确预测，我们才能识别哪些情况是"反常"，才有了反常现象可以研究。行为经济学是在已有框架内加入真实的人，而不是另起炉灶。

行为经济学经济学史