BOOK NOTES

驱动力

丹尼尔·平克

丹尼尔·平克写这本书的起点,是他发现行为科学界和商业实践之间有一条几十年都没有弥合的裂缝。学者在实验室里反复证明外部奖励会损伤内在动机,而企业照旧用胡萝卜和大棒驱动员工。他花了相当篇幅梳理这条裂缝的来源,然后提出一个替代框架:以自主、专精、目的为核心的驱动力3.0。

平克的论点建立在过去五十年的社会科学研究上,核心主张是:人类有第三种驱动力——想要自我掌控、持续提升、做有意义之事的内在欲望。生物冲动(饥饿、性欲)和外部奖惩之外,这种驱动力在合适的环境下会自发涌现,在控制性环境下会被压制甚至摧毁。

三种驱动力与操作系统的比喻

平克用"操作系统"做比喻:每个社会都有底层的行为假设在运行,决定了机构如何设计激励机制。

驱动力1.0 对应人类的生物冲动。适用于数万年前生存导向的生活,到今天依然在运作,但不足以解释复杂的人类行为。

驱动力2.0 在工业革命后成型,核心假设是:用奖励强化你想要的行为,用惩罚抑制你不想要的行为。泰勒的"科学管理"是这套系统最典型的软件。二十世纪大量的重复性工作确实在这套系统下运转良好。

驱动力3.0 是平克认为当前经济实际需要但多数机构尚未采纳的系统。它承认奖惩有其适用范围,但把自主、专精、目的列为更强大、更持久的动机来源。

这个比喻有一个实际用途:它帮助读者把问题从"某个具体政策好不好"提升到"整套底层假设是否还匹配当下的工作性质"。

驱动力2.0的三个不兼容问题

平克认为驱动力2.0系统在当代经济中出现了三类系统性失配:

行为配置方式变了。 维基百科、Linux、Firefox等开源项目的存在,无法用"人只受外部奖励驱动"来解释。数万名程序员不拿报酬,有时每周投入二三十小时,产出的软件质量超过了有薪资支撑的商业竞争对手。麻省理工学院的研究者对684名开源开发者调查后发现,最主要的动机是"以乐为本的内在动机"——解决问题带来的乐趣。驱动力2.0的框架里没有这种动机的位置。

对人类行为的理解变了。 行为经济学,尤其是丹尼尔·卡尼曼获诺贝尔奖的研究,证明人并不是完全理性的最大利益计算者。一旦放弃这个假设,驱动力2.0赖以成立的"给奖励就会理性响应"就失去了基础。苏黎世大学的布鲁诺·弗雷提出"成熟经济人"概念,认为不考虑内在动机,就无法充分解释经济行为。

工作性质变了。 平克把工作分为两类:推算型(algorithmic,有固定步骤和答案)和探索型(heuristic,没有既成算法,需要实验和创造)。二十世纪大量工作是推算型的,外部奖励对推算型工作有效。但麦肯锡预测,美国现在70%的工作增长来自探索型工作,而哈佛商学院的特里萨·阿马布勒的研究发现,外部奖励对探索型工作具有破坏性。驱动力2.0围绕"工作本来枯燥"这一假设建立,但越来越多的工作本身就有意思,需要的是投入而非服从。

奖励的七个副作用

这是本书最有实验支撑的一章。平克从多个独立研究中归纳出胡萝卜大棒的七个具体副作用,每一条都有实验证据。

1. 削弱内在动机。 德西在1969年的索玛立方块实验中发现:得到金钱奖励的学生,奖励结束后花在拼图上的时间比从未拿过奖励的学生少了约一分钟。心理学家莱珀和加兰对幼儿园儿童的研究也发现,承诺奖励("如果你画画就给你奖状")两周后显著降低了孩子主动画画的频率,而意外给出的奖励则没有这个效果。关键机制是:有条件的奖励要求人放弃部分自主权,这会从活动中抽走乐趣。

2. 降低成绩。 艾瑞里等人在印度马杜赖的实验把被试者分为低奖金、中奖金、高奖金三组,完成需要运动能力和创造力的任务。结果:高奖金组在9项任务中有8项成绩最差。伦敦政治经济学院对51家公司的绩效考核体系分析后得出类似结论:财务激励对整体绩效有消极影响。

3. 扼杀创造力。 蜡烛难题实验(把蜡烛固定在木墙上,不能滴蜡)中,有现金奖励的参与者比无奖励组平均多花了近三分半钟。原因是:奖励让人关注点变窄,看不到常见物品的新用途(把装图钉的盒子当作平台)。但如果把图钉从盒子里拿出来、把难题变成推算型任务,有奖励组反而更快——奖励对明确路径的竞争有效,对需要发散思维的问题有害。阿马布勒对23名专业艺术家的研究发现,受指派完成的作品在创造性上明显不如非指派作品,原因是指派带来了限制感。

4. 抑制善行。 瑞典经济学家对哥特堡血液中心153名有献血意向的女性实验:无报酬组52%决定献血;给50克朗报酬的一组只有30%献血;可以把钱捐给儿童癌症基金的一组则恢复到53%。金钱报酬把利他行为转化成了交易,把道德动机"挤了出去"。

5. 鼓励欺骗和走捷径。 西尔斯汽车维修工有销售额配额,结果收取不必要的维修费;安然公司的高营业额目标成为崩塌的催化剂;福特Pinto因赶工期忽略安全检查。哈佛、西北、宾大、沃顿等多所商学院学者发表联合报告指出,设定目标可能引发不道德行为,建议像处方药一样谨慎使用目标。

6. 引发上瘾。 俄罗斯经济学家苏沃洛夫用委托代理模型证明:一旦委托人开始给奖励,就相当于对代理人做出了"以后还会给"的暗示。科诺森用功能性磁共振成像发现,期待奖励时大脑伏隔核的活动模式,与使用成瘾药物时相似。奖励刺激减弱后需要加量才能维持效果,这与物质成瘾机制同构。

7. 滋生短视。 把注意力锁定在即时奖励上,必然压缩长期视野。许多研究显示,花大量时间给季度收益提供指导的公司,长期增长率低于较少提供指导的公司,且研发投入更少。2008—2009年金融危机中的每个环节——买家、经纪人、交易员、政客——都只在意短期利益,是这条规律的极端案例。

有效范围: 上述副作用主要发生在探索型、需要创造力的工作中。对于本身没有内在动机的机械劳动,"如果-那么"型奖励通常有效,因为没有内在动机可以被破坏。平克建议在使用这类奖励时做到三点:解释必要性,承认任务枯燥,给人选择方式的自由。

对于创造性工作,平克提出"既然-那么"型奖励(after-the-fact,意外给出,不事先承诺)比"如果-那么"型奖励危害小,因为奖励不会成为行动的原因,人们不会为了奖励而去做。非物质奖励(口头赞扬、具体反馈)副作用更低,德西的分析显示正面反馈对内在动机有提升效果。

I型与X型行为

平克借鉴弗里德曼的A型/B型行为以及麦格雷戈的X理论/Y理论,提出自己的分类框架:

X型行为以外在动机为主要驱动,更关注行为带来的外部奖励。驱动力2.0系统依赖并强化X型行为。

I型行为以内在动机为主要驱动,更关注行为本身的满足感。驱动力3.0系统依赖并强化I型行为。

六个关键区别:

  • I型是后天习得的,不是先天固定的,任何X型人都可以转变。
  • 长期来看,I型人的成绩通常超过X型人,尽管短期内高度关注外部奖励可能使人更快达到某个特定目标。
  • I型人不拒绝金钱,但金钱在达到"基线报酬"(足够且公平)后就不再是主要动机;X型人则把金钱本身当目的。
  • I型行为像可再生能源,自我补充,损耗小;X型行为像煤炭,需要不断外部投入且成本递增。
  • 研究显示,I型人自我评价更高、人际关系更好、总体健康状态更好;A型行为模式(冠心病风险)与X型行为倾向存在关联。
  • I型行为依赖三种营养素:自主、专精、目的。

自主:四个维度

平克把自主拆分为四个具体维度,每个维度都有企业案例支撑。

工作内容自主。 3M公司从二十世纪四十年代起允许技术人员用15%的时间做自己选择的项目,Post-it便利贴就来自这段时间。谷歌的20%时间催生了Gmail(工程师保罗·布赫海特)、谷歌新闻(科学家克里希纳·巴拉特)等产品,谷歌每年约一半新产品源于这段时间。澳大利亚软件公司Atlassian每季度实行"联邦快递日"(24小时完全自主,次日汇报),后来扩展为长期20%自主时间,并带来零离职率和持续创新。

工作时间自主。 百思买在总部推行ROWE(只问结果的工作环境),允许员工自己决定何时工作、在哪工作,只需完成目标。参与员工生产率提升35%,自动离职率比未改革团队低320个基点,且他们自己也说不清楚工作时间是否减少了。律师按小时计费制度是平克提出的反例:把投入时间与报酬直接绑定,导致关注点从工作质量转向时间积累,还有道德风险。

工作方法自主。 Zappos(在线鞋类零售商)的客服代表不使用脚本,不被监听通话时长,用自己的方式服务客户。结果是极低的离职率和客服满意度在同行业名列前茅,与凯迪拉克、宝马、丽嘉酒店持平。捷蓝航空从2000年起让客服代表在家工作,减少监视,排名持续领先竞争对手。

工作团队自主。 全食超市的员工自己决定是否录用试用期成员,投票决定是否全职雇用。戈尔公司(GORE-TEX制造商)要求晋升为团队领导者必须自己召集愿意跟随的人。谷歌工程师在20%时间内可以自发组建跨部门小团体推动公司层面的改变。

自主不等于独立,德西和瑞安明确区分了两者:自主是有选择权的行动,既可以独立也可以互相依赖;独立是美国西部牛仔式的单打独斗。康奈尔大学对320家小型企业的调查显示,允许自主的企业增长率是管理导向企业的四倍,人员流失率是后者的三分之一。

专精:三条法则

平克用心理学家希斯赞特米哈伊的"心流"理论作为专精的起点,然后提出专精遵循三条特别的规律。

心流是专精的入口。 希斯赞特米哈伊用寻呼机(后来是手机通知)随机记录人们的实时状态,建立了"经验取样法"。他发现:人们在工作中达到心流的频率高于休闲娱乐,条件是挑战与能力恰好匹配——任务既不太难(产生焦虑)也不太容易(产生厌倦)。他把这两个极端的中间地带称为心流区,在此状态下目标清晰、反馈即时、注意力完全投入、时间感消失。

他还做了一个直接验证实验:让参与者去除生活中所有"非工具性"的行为(单纯因为喜欢而做的事),仅仅48小时后,参与者开始出现头疼、注意力涣散、情绪恶化、睡眠障碍,与广泛性焦虑障碍的症状高度吻合。平克据此说,心流是心理健康的必需品,剥夺两天就足以触发类似临床焦虑的症状。

法则一:专精是心理定向(mindset)问题。 斯坦福大学心理学家卡罗尔·德韦克四十年的研究区分了两种"自我理论":认为智力是固定实体的"实体理论",和认为智力可以通过努力提升的"增量理论"。持实体理论的人把每次遭遇都视为智力测试,为了避免显得愚笨会回避挑战,倾向于选容易达成的表现目标;持增量理论的人把挑战视为成长机会,会选学习目标,在遭遇挫折后坚持时间更长,尝试的解法更多。德韦克的实验中,五六年级学生在面对超出能力的难题时,增量理论组继续尝试,有人甚至说"能怪谁呢"然后继续作答;实体理论组则很快放弃并归咎于"太笨"。专精只对增量理论者开放,因为实体理论者会在第一次失败时放弃。

法则二:专精是一种痛苦。 西点军校的研究发现,最能预测新生是否完成"野兽营房"(七周高强度训练)的因素不是体力、智力或运动天分,而是"坚毅"(grit)——对长期目标的坚持和热情。心理学家安德斯·埃里克森的研究表明,所有领域的卓越表现都需要至少十年的高强度刻意练习(deliberate practice)。刻意练习的特点:以提升成绩为目标,重复执行,获取批评性反馈,着力改善弱项,并且身心俱疲。社会学家钱布利斯对奥运游泳运动员的研究也得出类似结论,称之为"卓越的平凡"——最好的运动员在最普通的练习动作上花的时间最多。朱利叶斯·欧文(篮球运动员)对此的表述是:专业就是做你喜欢的事,即使在你不想做的时候。

法则三:专精是一条渐近线。 渐近线是曲线无限接近但永远不会相交的直线。专精永远不可能完全实现。泰格·伍兹被视为有史以来最伟大的高尔夫球手,他在最好的赛季结束后也会说自己还能做得更好。平克援引艺术史上对塞尚的评价:他永远在逼近自己最好的作品,那个最终成品对他来说是条渐近线。这条法则有两面:它是挫败感的来源(为什么要追求永远得不到的东西),也是吸引力的来源(追求过程的快乐大于实现目标的快乐)。

爱立信和瑞典绿色货运公司的实践提供了企业层面的支撑:爱立信让管理者每年六次与员工一对一讨论投入程度,每次九十分钟;绿色货运要求管理者每月了解员工工作负荷是过重还是过轻,并据此调整,帮助员工找到心流区。绿色货运在推行两年后实现了125年历史中的首次盈利。

目的:超越自身的渴望

目的是驱动力3.0三角桌的第三条腿。平克的说法是:自主和专精需要目的来告诉它们为什么值得。

罗切斯特大学的跟踪研究 是本章最重要的实证。德西、瑞安和同事对毕业生进行跟踪,分为"外在志向"(渴望财富和名誉)和"内在志向"(渴望学习成长、帮助他人)两组。结果:实现了内在志向的人自我满意度和主观幸福感高于大学时期,焦虑和抑郁水平低。但实现了外在志向的人——实现了积累财富、获得赞誉等目标——自我满意度并不高于大学时期,焦虑、抑郁反而上升。德西的结论:有些东西,得到了不会让你更好,反而会让你更糟。这个发现的含义是:达到目标能否带来满足,取决于目标的性质,而非目标是否达成。

目的驱动在组织中的三种体现:

目标层面: TOMS鞋业每卖一双鞋就向发展中国家儿童捐一双,自我定位为"营益性公司"。"低利润有限责任公司"(L3C)、B型企业、社会型企业等新商业形态在多个国家获得法律认可,它们共同之处是把目的最大化和利润最大化并列,而非以利润最大化为唯一准则。

誓言层面: 2009年哈佛商学院部分学生发起"MBA誓言",承诺管理目的是创造社会价值而非仅对股东负责。加里·哈梅尔指出,"效率"、"利益"、"价值"等词语缺乏唤醒人类心灵的能力,需要将"荣誉、真相、爱、公正和美"带入日常商业活动。里兹的代词测试(员工说"他们的公司"还是"我们的公司")是衡量目的感的简单方法。

政策层面: 平克批评了一种常见做法:将道德准则折算为检查清单,结果把员工从内在动机(做正确的事)驱向外在动机(避免被起诉)。他援引两个替代性政策:英属哥伦比亚大学的研究显示,把钱花在别人身上或捐给某项事业,比花在自己身上更能提升主观幸福感;梅奥诊所让医生每周一天从事对他们最有意义的工作(照顾病人、研究、社区服务均可),参与医生疲惫程度比未参与者低一半。

使用与限制

书中的建议几乎全部指向知识工作者和探索型工作,作者本人也承认这一适用范围。他明确说:对于机械重复的工作,"如果-那么"型奖励仍然有效,且副作用可控。

平克的框架在以下场景下操作性较强:

  • 需要持续创造力的岗位(工程师、设计师、研究员、写作者)
  • 可以明确区分"产出"与"过程"的工作,使得ROWE或结果导向管理成为可能
  • 组织有足够余地设计工作内容、时间和团队的弹性

以下场景适用性有限:

  • 服务性工作中需要严格流程合规的部分(食品安全、医疗操作规范等)
  • 外包、低薪、高流动率岗位,"基线报酬"本身就未达标
  • 需要大量协调和统一行动的工作

书中的实验研究多来自心理学实验室和有限的企业案例,生态效度参差不齐。谷歌的20%时间和Atlassian联邦快递日产生了具体成果,但也是在特定公司文化和行业背景下实现的,不能直接复制到每个组织。平克自己也注意到,向ROWE过渡需要"脚手架",突然从高控制环境切换到完全自主会产生适应困难。

卡罗尔·德韦克关于成长型心理定向的研究,以及安德斯·埃里克森关于刻意练习的研究,是本书理论基础中被后续研究最多检验的部分。德韦克的心理定向干预效果已在多个跨文化研究中得到复制;埃里克森关于"一万小时"的说法(虽然媒体简化了他的原意)也引发了较多争议,他的原始表述更为严谨——强调刻意练习的质量而非单纯时长。

几个可直接使用的操作点

奖励设计: 区分两种奖励模式。"如果-那么"型(事先承诺、有条件)适用于机械工作,但对创造性工作有害。"既然-那么"型(任务完成后意外给出、非条件性)副作用更小,但一旦形成规律期待,就会退化为前者。

表扬方式: 德韦克的研究指出,表扬努力和策略("你在这道题上试了三种方法")比表扬天分("你真聪明")对儿童和成年人都更有利于持续投入。具体、私下、基于真实表现的表扬优于泛化的公开表扬。

心流测试: 用手机设置随机提醒,每天八次左右,记录当前活动和心理状态。持续一周后分析哪些时刻最接近心流,然后评估日常安排是否可以向那些时刻倾斜。

自主审计: 向团队成员匿名调查四个维度各自的自主程度(0—10分):工作内容、工作时间、团队选择、工作方法。结果往往与管理层的直觉有明显偏差,可以作为改进优先级的依据。

绩效评估改为自我评估: 每月把自己"叫进办公室",对照自己设定的学习目标和表现目标评估进度,完全诚实,不为失败合理化。这个频率比年度评估更能接近刻意练习中的"即时反馈"。

目标性质检查: 德西和瑞安的研究提示,外在志向(财富、名誉)即便实现也不会带来更高幸福感,有时反而相反。在设定中长期目标时,值得检查哪些是"利益目标",哪些是"目的目标",以及两者的比例是否符合自己的预期。