一句话总结
参考类预测(RCF)是反自恋装置:把”我是一个故事”切换为”我是一个样本”——预测未来的最有效指导不是梦中的叙事,而是同类人同类事的统计分布。
核心论点
- 规划谬误:人系统性低估时间/成本/风险,高估收益(Buehler 1994:学生最悲观估计 48.6 天,实际 55.5 天)。
- 大型项目同样翻车:傅以斌 研究 258 个交通项目,铁路平均超支 45%;悉尼歌剧院预算 700 万→1.02 亿,4 年→14 年。
- 幻觉机器:乐观偏差、确认偏误、控制错觉、自利归因、幸存者偏差、可得性偏差、叙事谬误 共同作用。
- 解药:从 内部视角 切到 外部视角——卡尼曼 Thinking, Fast and Slow 中的”决策学教材”案例(团队估 2 年、外部专家说 7–10 年、实际 8 年且需求消失)。
- RCF 三步法(傅以斌 标准化):找参考类 → 看分布基准线 → 把自己放进去对比,必要时上调。
- 应用:香港道路工程 P80 上调(成本 +44%,工期 +75%);企业并购、电影票房(随机森林 90% 准确率)、核聚变(投资上调 118%–220%)。
- 即使马斯克也逃不掉规划谬误:FSD、SpaceX 早期、xAI。
- 具体做事用内部叙事打气;决策必须用外部参考类泼冷水。
关键概念
引用人物与著作
- 万维钢 — 课程主理人
- 丹尼尔·卡尼曼 — 1993 提出外部视角;决策学教材案例
- 傅以斌 — Bent Flyvbjerg;把 RCF 推广到工程实践
- 罗杰·比勒 — Roger Buehler;规划谬误研究
- 山姆·奥特曼 — Helion 核聚变案例
- 埃隆·马斯克 — FSD/SpaceX/xAI 案例
- How Big Things Get Done — Flyvbjerg 2023 著作
- 思考,快与慢 — Kahneman 2011 著作
与其他课程的连接
- 与 凯利公式:乘法世界里的认知变现:参考类是估 p 的客观依据。
- 与 前景理论:让人铤而走险的不是贪婪,而是不甘:内部视角让你被参照点驱动;外部视角让你看见客观分布。
- 与 OODA 环:不是反应快,而是换脑快:RCF 是定向时的客观锚。
- 与 信息价值:怎样区分沙子和金子:参考类数据是低耀眼但高 VOI 的信息。
- 与 复利:可积累的优势:幸存者偏差 是反例。
我的反应
原文
来源:https://www.dedao.cn/course/article?id=zYo2GPNq4W8VEbwmLaJejyRBZbnw0d 出处:现代思维工具100讲 · 13分37秒 转述:怀沙AI
一个高中生每天刷题到深夜,常被自己流下的汗水感动。父母都说他一定行,他也认定只要这么拼命,就一定能考上清华。
一个都市女性坚信自己只要不将就,一定能等到那位身披金甲圣衣脚踏七彩祥云非她不娶的盖世英雄。
一个创业者刚刚想出了一个产品雏形,就已经在脑子里把用户增长曲线画成了火箭。
这些都是非常可爱的人。他们身上有一种真诚的英雄主义,他们是生活的主角,世界因为他们而精彩。但是他们都活在梦中。
我们说了,这个宇宙的第一性原理是叙事。人需要叙事给自己意义。我们都最好有一点热情,有一点想象,甚至有一点自我感动。可你要想科学计划,对未来做出靠谱预测,最有效的指导可不是你梦中的叙事,而是同类人、同类事已经发生过的经验。
这一讲的思维工具叫「 参考类预测 (Reference Class Forecasting, 简称 RCF)」。它本是一个预测算法,但在我看来,它更像是一个”反自恋装置”。如果你认为”我很特殊”、“我这次一定不一样”,你最好先用一下这个工具。
✵
关于梦想和现实的差距,有个现成的规律,叫「规划谬误(Planning Fallacy)」。
心理学家罗杰·比勒(Roger Buehler)等人的一个研究是这样的 [1]。让一群学生估算他们各自完成毕业论文还需要多少天,学生们平均给出的预期是 33.9 天。比勒说不行,你们太乐观了,你们来一个最悲观的估计!这回平均是 48.6 天。
你猜他们实际上用了多少天?55.5 天。
规划谬误说的就是人一做计划,就会系统性地低估时间、成本和风险,同时还高估收益。现实往往比你最悲观的估计还要悲观。
那你说是不是只有普通人这样,要是做正规大项目人们就会准确估计呢?不是。我们前面提到过的丹麦经济学家傅以斌(Bent Flyvbjerg)是大型项目专家,他跟合作者研究了 258 个交通基础设施项目,发现普遍存在延期和成本超支 —— 其中铁路项目平均超支 45%,桥梁和隧道 34%,公路 20% [2]。傅以斌专门写了本书谈论大项目规划失败问题 [3],其中最著名的例子是悉尼歌剧院:原本预算 700 万美元,计划 4 年完工,结果花到 1.02 亿美元,14 年才完工。

规划谬误是「一厢情愿」这个成语的现代版,它是大脑里一系列幻觉生成器共同造就的 ——
「乐观偏差(Optimism Bias)」告诉你”这次一定顺”;「确认偏误(Confirmation Bias)」让你只搜集利好证据;「控制错觉(Illusion of Control)」让你以为世界井井有条、意外情况都在掌控之中;「自利归因(Self-Serving Attribution)」让你把上次翻车怪到天气、队友和甲方头上;「幸存者偏差(Survivor Bias)」和「可得性偏差(Availability Bias)」让你只看见成功故事而看不见沉在水底的尸体……最后「叙事谬误(Narrative Fallacy)」则负责把这些碎片拼成一部热血电影。
你脑子里排练的是剧本,而不是真实世界。
而你之所以用剧本思考,是因为你使用的是「 内部视角 (inside view)」。你自己看自己,就只知道盯着这一件事的细节、你的努力、你的诚意、你的资源配置 —— 你心想这还能有啥问题?
当局者迷旁观者清,你需要外部视角。
✵
「 外部视角 (Outside View)」和参考类预测都起源于卡尼曼 [4],后来则是由傅以斌把参考类预测从心理学推广到了工程实践 [5]。
简单说,内部视角看的是你的个案信息(singular information),而外部视角看的则是分布信息(distributional information):在别人眼里,你只是一个受制于客观规律的统计学数据点,你并不特殊。
外部观察者关心的是跟你条件差不多的同类事情 —— 也就是你的「参考类(Reference Class)」 —— 的分布:平均水平如何、中位数是什么、尾部风险是怎样、失败率是多少,并且以这些统计数据来推测你会如何。
内部视角盯住本项目,外部视角先看同类项目,这就是「当局者迷,旁观者清」的现代认知科学版本。旁观者未必比你聪明,但旁观者的好处是没有你那么多自恋情结:人家把你当成样本,而不是当主角。

这里有个最经典的故事,来自卡尼曼本人,收录在《思考,快与慢》一书中。
1970 年代,卡尼曼带队编写一本给高中生的决策学教材。团队第一次开会,卡尼曼问,我们多长时间能把这本书编完?大家群情激昂,信誓旦旦地说:两年!最多两年就能搞定!但卡尼曼留了个心眼,转头问团队里一位教育专家:“你认识的、跟我们条件差不多的团队,编这样一本书通常要几年?”
专家说大概 7 到 10 年,而且有 40% 的团队最后干脆放弃了。
卡尼曼很震惊,但他想我们团队肯定不至于,我们效率更高。
……结果卡尼曼团队花了整整 8 年才把书搞出来。而那时候教育部已经取消了这门课的教学需求。
你以为你们不一样,其实每个人都觉得自己不一样。现实是,在统计学意义上大家都一样。
✵
傅以斌把参考类预测标准化成了三个步骤 [6]:
第一步,找一个数量足够多的、包含和你类似的项目的「参考类」 —— 不是你喜欢的榜样,而是找一组和你足够相似、而且已经结束的案例;
第二步,看看这个参考类的分布,找到它的基准线,包括平均成本、时间、失败率等等;
第三步,把你自己的项目放进去对比,根据客观情况做微调:我更像是中位数,还是应该更保守一点?
第三步是最考验人的一步。其实最简单的办法就是直接用参考类里的中位数来预测自己。傅以斌再三强调,如果你非要说你跟别人不一样,那你就必须有非常强硬的证据才行 —— 不然你就是在把偏见又偷偷放回来。
有些现代机器学习算法的底层逻辑就是参考类预测。一切归结于你的”训练集(参考类数据)“有多大,以及你的”相似性度量(similarity metric)“抓得准不准,说白了就是把”找同类”这个动作给工业化了 [7]。
要知道自己做这件事会怎样,你最该考察的是和你相似的人、在做相似的事情时,最后都怎么样了。
参考类预测(以下简称 RCF)就是强迫你从”我是一个故事”切换到”我是一个样本” —— 故事负责解释你是谁,参考类负责预测你会怎样。
✵
每个自命不凡的项目都会被 RCF 教训。咱们看几个比较耀眼的应用。
一个是 大型工程和公共投资 ,这是 RCF 的主战场。傅以斌看过那么多项目之后的结论是:如果不用 RCF 强制纠偏,你的工程几乎一定会超期和超支。怎么纠偏呢?香港政府给了一个范例。
2012 年,香港开始把参考类预测引入道路工程评估。他们把自己的 25 个道路项目,跟 863 个国际同类项目做比较,先看同类工程过去通常会怎么超支、怎么拖期,再反过来修正自己的计划。结果发现,在项目的筹备论证(Category C)阶段,因为方案还比较粗、不确定性大,如果你希望把风险控制到各自 P80 —— 也就是有 80% 的把握不超预算、不拖工期 —— 那么一开始报上来的数字就不能照单全收,而是要做「上调(uplift)」:成本要上调 44%,工期要上调 75% [8]。
越是项目刚起步,大家最有激情、最容易拍胸脯的时候,你越不能信内部视角。工程界最贵的一句话,就是”我们这次能控制得住。”
一个是 企业并购 。每个 CEO 都喜欢收购别人的公司,因为这能让你的权力扩大,属于开疆拓土。CEO 说并购会带来协同效应,我们战略互补必能整合市场……但你只要看一看参考类就知道,平均而言,收购方公司的业绩并不会因为并购而改善,甚至会受到轻微负面影响 [9]。
CEO 对此会说:“别的公司并购失败是因为他们整合能力不行,我们公司这次不一样,我们的企业文化天下无敌!“学者们不得不想出更先进的办法,用机器学习把 RCF 自动化 [7],提高预测准确率 —— 从历史上找一批和这次高度相似的并购,把它们的结局摆出来,完了再听 CEO 解释为什么这次不会翻车。
一个是 电影票房 。如果你要投巨资拍一部大片,你最好先有效预测一下它能不能火。而以前好莱坞的火是一种玄学:2008 到 2012 年美国上映的电影里,超过一半都没有盈利,而前 10% 的电影却能吃掉将近 70% 的票房收入……可是没人知道谁能进前 10%。
与其讲情怀,不如看 RCF。2023 年发表的研究中 [10],有人用基于 RCF的”随机森林(Random Forest)“模型,使用更细的颗粒度把电影进行分类,把”能否覆盖成本”预测准确度提高到了 90%。
还有一个是现在进行时, 核聚变 。现在 AI 算力中心导致美国电力不堪重负,科技巨头纷纷考虑用核聚变发电。我以前就是研究核聚变的,我非常不相信十年之内核聚变有商业化的可能性,可是巨头们明显要乐观得多。
OpenAI CEO 山姆·奥特曼(Sam Altman)自己就投了一家核聚变公司,叫 Helion。2021 年的时候,Helion 曾经宣称要在 2024 年发电。可是等到 2023 年跟微软签约时,电力交付的时间表被推迟到了 2028 年。2025 年 Helion 才开始建设面向微软供电的厂址。到 2026 年,Helion 说他们的原型机取得了”新的里程碑”……我不知道里程碑到底前进了多少,但我知道发电时间表一直在后退。

因为现在还没有一家核聚变设施能发电,我们没有现成的参考类,但是我们可以参考类似高复杂度的项目。有研究 [11] 用相似高难度项目估算,聚变的上调大约是 118%;如果你用国际级大型科研基础设施做参考类,上调甚至可能达到 220%。
简单说就是,如果一个核聚变项目说要多少投资,你最好准备三倍以上的钱。
就连号称整天思考「第一性原理」的马斯克,也逃不掉规划谬误。他承诺的特斯拉全自动驾驶(FSD)几乎每年都说”明年就能实现”,拖了将近十年。当年创办 SpaceX,马斯克用内部视角做预算,认为 1 亿美元足够发射 3 次火箭,怎么也成功了 —— 结果三次全部爆炸,公司濒临破产,最后靠砸锅卖铁凑出来的第 4 次发射才侥幸成功。最近马斯克又说 xAI 将很快大幅度领先所有 AI 公司,请问你信吗?
✵
当你开始学习一门新技能,认为自己一个月就能精通,两个月就能靠它赚到钱的时候,当你准备周末搬家,认为半天就能打完包的时候,当你给新房装修设定 30 万元预算和三个月时间的时候,请你想一想前面这几个案例,和卡尼曼当年那个故事。
豪情万丈的愿望不是预测,下决心努力不是预测,基于需求的计划表更不是预测。你最好先想想自己过去那三次学习新技能,都是在第几天放弃的;看看别人家搬家平均会出几次幺蛾子;问问同小区、同户型,装修平均拖几天,超多少钱。
把自己只当个样本,会让你的计划精确很多,而且可以让你更有底气。
很多求职者,尤其刚毕业的大学生,对钱没有概念,不知道该要多少工资。有些人倾向于多要,但也有很多人是要少了。你应该考虑的不是你每月房租和生活开销需要多少钱,而是参考类。到各大招聘网站调研一番,找师兄师姐问一问,像你这样的学历和技能,在相应的城市大概值多少钱。别忘了,招聘方可是早就把你这样的人给研究得明明白白。
这就如同找对象,如果你想的是”像我这么优秀的人,必须配什么什么样的人”这种内部叙事,靠谱的婚介服务给你的推荐就一定会让你失望 —— 因为它用的是 RCF。
✵
当然不是每个人都应该活成中位数。很多人都在某一方面与大多数人不同 —— 但如果你找对了参考类,你会发现你跟不在少数的人很相似。
每个人都是特殊的。但你的天赋、资源和方法论,是否特殊到让你不属于当前这个参考类呢?如果是那样的话,你还是不能听从内部叙事 —— 你属于下一个参考类。
每个进京赶考的读书人都觉得自己会拯救中国,打算主导改革匡扶正义。殊不知主考官看到的不是热血,而是你的门路、师承、年龄和品性 —— 他们太知道像你这样开局的人最后都去了哪里了……
具体做事,不妨用内部叙事给自己打气;决策,却必须用外部参考类给自己泼冷水。

注释
[1] Buehler, Roger, Dale Griffin, and Michael Ross. 1994. “Exploring the ‘Planning Fallacy’: Why People Underestimate Their Task Completion Times.” Journal of Personality and Social Psychology 67 (3): 366–81.
[2] Flyvbjerg, Bent, Mette K. Skamris Holm, and Søren L. Buhl. 2003. “How Common and How Large Are Cost Overruns in Transport Infrastructure Projects?” Transport Reviews 23 (1): 71–88.
[3] Flyvbjerg, Bent, and Dan Gardner. How Big Things Get Done: The Surprising Factors That Determine the Fate of Every Project, from Home Renovations to Space Exploration and Everything In Between. New York: Currency, 2023. 我们专栏有过解读:《精英日课》第五季, 怎样做成大事1:慢慢谋定,快速行动
[4] Kahneman, Daniel, and Dan Lovallo. 1993. “Timid Choices and Bold Forecasts: A Cognitive Perspective on Risk Taking.” Management Science 39 (1): 17–31.
[5] Flyvbjerg, Bent. 2008. “Curbing Optimism Bias and Strategic Misrepresentation in Planning: Reference Class Forecasting in Practice.” European Planning Studies 16 (1): 3–21.
[6] Bent Flyvbjerg. “From Nobel Prize to Project Management: Getting Risks Right.” Project Management Journal, 37(3): 5–15, 2006.
[7] Bi, Wenbin, and Qiusheng Zhang. 2021. “Forecasting Mergers and Acquisitions Failure Based on Partial-Sigmoid Neural Network and Feature Selection.” PLOS ONE 16 (11): e0259575.
[8] Flyvbjerg, Bent, Chi-keung Hon, and Wing Huen Fok. 2016. “Reference Class Forecasting for Hong Kong’s Major Roadworks Projects.” Proceedings of the Institution of Civil Engineers 169 (6): 17–24.
[9] King, David R., Dan R. Dalton, Catherine M. Daily, and Jeffrey G. Covin. 2004. “Meta-Analyses of Post-Acquisition Performance: Indications of Unidentified Moderators.” Strategic Management Journal 25 (2): 187–200.
[10] Einberg, Isak, and Arian Hanifi. 2023. Forecasting U.S. Movie Gross Revenues: A Random Forest Classifier Approach Based on Pre-production Data. Stockholm: KTH; de Souza, Thiago L. D., et al. 2023. “Revisiting Predictions of Movie Economic Success: Random Forest Applied to Profits.” PLOS ONE 18 (3).
[11] Brown, Chris, Hanni Lux, and James R. Cowan. 2024. “Reference Class Forecasting and Its Application to Fusion Power Plant Cost Estimates.” IEEE Transactions on Plasma Science 52 (9): 3628–33.
划重点
1.参考类预测:内部视角看的是你的个案信息,而外部视角看的则是分布信息。外部观察者关心的是跟你条件差不多的同类事情 —— 也就是你的「参考类」 的分布:平均水平如何、中位数是什么、尾部风险是怎样、失败率是多少,并且以这些统计数据来推测你会如何。
2.参考类预测标准化成了三个步骤 :
第一步,找一个数量足够多的、包含和你类似的项目的「参考类」 —— 不是你喜欢的榜样,而是找一组和你足够相似、而且已经结束的案例;
第二步,看看这个参考类的分布,找到它的基准线,包括平均成本、时间、失败率等等;
第三步,把你自己的项目放进去对比,根据客观情况做微调:我更像是中位数,还是应该更保守一点?