一句话总结
选择偏差:进入你视野的样本并不等概率代表真实世界——就算无人说谎,你看到的也不是真实世界;本讲把这个工具拆成自我选择/幸存者/分组选拔/门槛四类,并给出”四问诊断法”。
核心论点
- 怀念过去并不是怀念中国的平均值,而是被强烈过滤过的”上桌样本”——以前是少数城市精英冒充总体,现在是普通人 + 平台算法。中国文化没降级,是扩容了。
- 选择偏差(selection bias)的本质:进入视野的样本并不等概率代表真实世界。学界发现十几种,万维钢粗略归为四类。
- 第一类「自我选择偏差」(Self-selection Bias):来参加的都是想要来参加的人——朋友圈悖论、网络评论 J 型分布、国际新闻。引发朋友圈悖论——使用 Facebook 越频繁越觉得别人幸福(Chou & Edge 2012);限制社媒每天 30 分钟以下显著降低孤独/抑郁(Hunt 2018)。
- 第二类「幸存者偏差」(Survivorship Bias):没来的人不是没兴趣,而是根本来不了——是商业世界最致命的认知陷阱,因为它会让你总结错误的成功经验。增长最快公司创始人平均年龄是 45 岁,不是 20 多岁(Azoulay et al. 2020);基金幸存者偏差让公司业绩被系统性高估(Elton et al. 1996; Carhart et al. 2002);流行病学有「健康工人幸存效应」专门描述蓝领健康假象。怀旧也大量混入幸存者偏差(Norberg 2020)——记忆替过去做了一轮筛选。
- 第三类「分组选拔偏差」(Sorting Bias):问题出在分配环节本来就不是随机的——名校效应是经典案例。Dale & Krueger 2002 比较”都有能力上名校但有的去了有的没去”的学生,发现名校对长期收入的影响接近零;只对弱势家庭学生明显有用。名校更像筛选器,而不是炼丹炉。
- 第四类「门槛偏差」(Threshold Bias),又名「伯克森悖论」:你看到的都是跨过某个门槛之后的样本——两个原本不相关的变量,加和后设门槛,门槛内的样本就显得负相关。“长得帅的男人都是渣男”、“业务强的人情商低”统统是门槛伪造的规律(Westreich 2012)。
- 「四问诊断法」:①谁没来?②谁来不了?③分组是随机的吗?④这里有没有门槛?
- 与 可得性偏差、确认偏误互补:选择偏差是样本有问题,那两个是眼睛有问题。
- 收束诗:“灯下看人皆匆忙,瀑前观水势奔狂;若问世间真面目,先寻沉默与退场。“
关键概念
引用人物与著作
- 万维钢 — 课程主理人
- 斯泰西·戴尔 — Stacy Dale;名校效应实证研究
- 艾伦·克鲁格 — Alan Krueger;名校效应实证研究
- Johan Norberg — Open: The Story of Human Progress(2020)
- 山姆·奥特曼 — 创业辍学叙事中被列举的”幸存者”案例(与比尔·盖茨、乔布斯、扎克伯格并列)
- Open: The Story of Human Progress — Norberg 2020;怀旧的幸存者偏差证据
与其他课程的连接
- 与 回归均值:不要大惊小怪,要有点定力:上一讲。回归是把波动当因果,本讲是看不全数据;卡尼曼/特沃斯基所属的偏差谱系两讲互补。
- 与 参考类:当局者迷,旁观者清,你不特殊:幸存者偏差 也在那一讲被点名;外部视角 的天敌就是只看见赢家。
- 与 凯利公式:乘法世界里的认知变现:成功学是把幸存者运气当因果——凯利公式要求看清真实优势 Edge,不能被冠军橱窗误导。
- 与 复利:可积累的优势:长期主义的前提是不离场;幸存者偏差让人忽视”离场者”的教训。
- 与 信息价值:怎样区分沙子和金子:要做出”四问”才能让样本贡献真信息。
- 与 共鸣:高级生活的秘密中提到的 比较:朋友圈悖论本质上就是错把别人的”高光集锦”当生活的随机切片。
- 与 可得性偏差 / 确认偏误:选择偏差是样本问题,那两个是眼睛问题,三者经常叠加。
我的反应
原文
来源:https://www.dedao.cn/course/article?id=qzNakylrn9WVaZWMxGJ7DOop10vZwL 出处:现代思维工具100讲 · 13分58秒 转述:怀沙AI
如果你年纪稍长还经常上网,会不会有一种社会文化”今不如昔”的感慨。
现在网上充斥着博眼球的烂梗和家长里短的市侩哲学,一开口就是牛马、彩礼、出轨,连主流媒体都不会说正经中文了。偶尔把以前拍的《红楼梦》《三国演义》电视剧翻出来看看,你难免会觉得这届观众不行,中国人的文化素质在严重下降。
再看线下,很多人怀念上世纪八十、九十年代的好时光。那时候如果你是个国企职工,工作不但一点都不累,还有丰富的业余文化生活,有充分的安全感。那时候的大学生毕业就能随便找到好工作,而且素质也是真高……
可我要说的是,就算你真的经历过以前那些好日子,你这场乡愁也是幻觉。
八十年代初中国人口城镇化率只有 20%,到 1990 年高等教育毛入学率才 3%……而今天,城镇化率已经达到 67%,大学入学率超过 60%。你记忆中那些快乐的工人和自豪的大学生,在以前是极少数人 —— 绝大多数中国人居住在农村,极度贫困,他们不是文化消费者更不是叙事主体,他们连抱怨都很难被你听见。
今天的社会文化之所以俗气,是因为这些原本沉默的人上网了:他们成了收视的主体和广告的目标,是他们在决定文化的走向。
中国文化不是降级了,而是扩容了。
今天那些住在前 20% 的好地区、学历高居前 3% 的精英,可能日子过得也不错、品位甚至比过去更高级,但他们的文化存在感被淹没了:不值得专门为这么点人拍电视剧。
人们怀念的,并不是过去中国的*平均值*,而是那个被强烈过滤过的中国。你的印象不是由全体样本决定,而是由”上桌样本”决定:以前是少数城市精英样本冒充了中国总体,现在影响你的则是更普通的人,还有平台算法的推波助澜。
这个机制叫「 选择偏差 (selection bias)」。现实世界中有太多观念陷阱,你必须掌握这个工具,才可能做出准确的判断。
✵
简单说,选择偏差就是进入你视野的样本,并不等概率代表真实世界。
你以为你在观察整个大海,殊不知你只是在看渔网里捞上来的鱼 —— 而这张网的网眼大小、下网的位置,早就决定了你会看到什么。
又好比你站在急诊室门口看一整天,得出结论说”这座城市的人都在流血” —— 你看到的每一幕都是真的,没有人在故意对你说谎,但你的世界观是假的。我看过一个短视频,一位在亲子鉴定机构工作的女士说,她经历了这么多案例,认为男性才是弱势群体……她可能没意识到绝大多数夫妻没有来做亲子鉴定。
学术界发现了十几种选择偏差,我把它们粗略分为四类。
✵
第一类叫「 自我选择偏差 (Self-selection Bias)」。就如同开一场 party,来参加的人,都是自己*想要*来参加的。
最典型的一个现象,我们不妨称之为「朋友圈悖论」:你感觉朋友圈上几乎每个人都过得比你好。小张在马尔代夫潜水,小李刚提了新车,老王的女儿拿了钢琴大赛一等奖,而你,却在吃着外卖填报表。
他们没有撒谎,但人们往往只会把自己*好的一面*展示出来 —— 发朋友圈这个动作经过了自我选择。那对刚因为房贷吵完架的夫妻,那个刚刚被老板痛骂的打工人,正如此刻的你,是不会发朋友圈的。

朋友圈是人生的高光时刻集锦,而不是生活的随机切片。可是如果有人不懂这个道理,非得拿自己的日常去对比别人的宣传海报,那就会陷入选择偏差,感觉失落。有研究发现,使用 Facebook 越频繁的人,越容易觉得别人更幸福、日子过得更好 [1];而如果能把社交媒体使用限制到每天 30 分钟以下,人们就会显著减少孤独感和抑郁感 [2]。
另一个例子是网络评论。为什么很多电影、商品、餐馆的评价都呈现所谓「J 型分布」:绝对的主力在五星吹爆,次高峰在一星痛骂,中间的二、三、四星极少?因为只有当一个事物激发了你强烈情绪的时候,你才有动力去打开 APP、登录、写字、发表,“还行吧”那种温和体验没有发言动力。
更细致的研究 [3] 认为评论背后有两层自我选择 —— 除了极端者发言的漏报偏差,还有一层是购买偏差,也就是愿意买的人本来就更可能偏正面……
平台为了让评论更有用绞尽了脑汁,有的搞默认好评、已购才能评、积分激励、评价提醒等等,但偏差是无法消除的。根本问题不是技术,而是动力:不是每个人都想说话,想说话的人也不是平均人。
还有,你打开国际新闻,感觉世界太乱了;你打开社会新闻,感觉人的素质江河日下;你觉得某些国家极其危险,某些地方的人都很坏……这些都是因为自我选择偏差:只有极其罕见、极其恶劣的事件,才值得上新闻;岁月静好可不会上热搜。
自我选择偏差会让人长期处在一种被极端样本包围的精神状态,容易陷入无谓的焦虑、抑郁和心态失衡。
须知社交媒体不是生活,评论区不是民意,热搜不是人间。
✵
第二类叫「 幸存者偏差 (Survivorship Bias)」。如果说自我选择偏差是”有兴趣的人才来”,幸存者偏差就是:没来的人不是因为没兴趣,而是因为根本来不了。
幸存者偏差可能是商业世界最致命的认知陷阱,因为它会帮你总结错误的成功经验。
如果你只看巨头的传记,你会认为要想成功就得有极度的激情,敢于冒险,就得打破常规甚至做个偏执狂,要对新机会”All in”,尤其是要在很年轻的时候创业:比尔·盖茨、乔布斯、扎克伯格、山姆·奥特曼都没读完大学……于是你得出结论,成功 = 辍学 + 孤注一掷。
可是你不知道同样年轻、同样孤注一掷而*失败了*的人有多少。那些人都赔光、失业、回老家了,他们没有进入你的视野。
如果把失败的数据也统计进来,你会发现大部分创业公司都在半路消失了;增长最快的公司的创始人平均年龄并不是二十多岁,而是 45 岁:他们成功不是因为他们叛逆,而恰恰是因为他们积累了行业经验 [4]。
你不能听说几个人靠买彩票发了大财,就把买彩票视为理想的发财手段。成功学往往是把幸存者的运气当成因果关系。
理财基金是另一个重灾区。你要买理财,基金公司的小姐姐打开一张图表,说你看我们的历史收益多漂亮。她很可能没有骗你。但是她不能证明这只基金的业绩好到底是因为公司能力强,还是因为在这一只上蒙对了运气 —— 因为她没给你看失败的数据。
现实是那些业绩糟糕、早就清盘、合并、死掉的基金,根本没机会站在你面前。金融学界早就研究过这个现象:如果只看基金样本的幸存者,公司真实业绩就一定会被系统性高估 [5]。
你看见的是冠军橱窗,却不知后院堆着一地尸体。
有人说某个偏方能治大病、某种健身法或者饮食疗法神奇,其实只不过是感受到好转的人更愿意出来讲故事,没效果的人早就离场了。
有人看见现在坐办公室的白领动不动就抑郁、亚健康,反倒是工厂里的蓝领工人一个个都特别壮实扛造,就说体力劳动有利于身体和精神健康 —— 其实真相是那些不健康的人根本承受不住工厂的重体力劳动,早就被淘汰了。流行病学对此甚至专门有个名词,叫「健康工人幸存效应(Healthy Worker Survivor Effect)」[6]。
还有,怀旧,也有很大的成分是幸存者偏差 [7]。要知道人的记忆有个特点:从长期来看,我们记住的往往是一些高光时刻,我们会忘记困惑和麻烦。
有人怀念以前的文艺作品,有人怀念以前的社区关系,有人怀念以前的政治局面。可是如果你能到现场考察一番,会发现以前的人也有跟我们一样的担心 —— 他们在怀念更早的以前。以前你很年轻,而年轻总是伴随各种美好的回忆;以前的你的麻烦都解决了,所以你不再认为它们是麻烦,而现在的麻烦还没解决。
不是时代退步了,而是时间替过去做过一轮筛选。
✵
第三类叫「 分组选拔偏差 (Selection / Sorting Bias)」。问题出在事物一开始的分配环节:它根本就不是随机分组的。
这里有个最反常识、也最刺痛中产阶级神经的例子,名校效应。
你砸锅卖铁也要买学区房,牺牲所有的空闲时间领孩子去参加这个活动那个活动,只为能上重点中学和好大学,最好是常春藤名校。你相信名校代表最好的教育,能把孩子培养成高级人才……但这是一个极度忽视科学检验的幻觉。
孩子们并不是被闭着眼睛随机分配到各个学校的,他们是经过了严苛的选拔才进去的。那些被选中的本来就是又聪明又努力、家庭条件又好的孩子,他们本来就更有可能是人才 —— 那么名校到底是培养了他们,还是沾了他们的光呢?
美国经济学家斯泰西·戴尔(Stacy Dale)和艾伦·克鲁格(Alan Krueger)做过一系列研究 [8]。他们不是简单比较”名校生”和”普通校生”的收入,而是专门看那些水平差不多、都有能力去名校,但是有的去了、有的因为种种原因没去,而选择了普通学校的学生。结果发现,名校并没有让毕业生获得明显更高的收入 —— 尤其是如果你看长期收益,名校效应就缩水到接近于零。
戴尔和克鲁格的研究认为,只有对出生于弱势家庭 —— 比如是少数族裔,父母受教育程度很低 —— 的学生,名校这块牌子才有明显的帮助。可能是因为他们更需要学校这个社交平台。
简单说,名校更像筛选器,而不是炼丹炉。
同样道理,你不能看有些孩子补课提高成绩,就认为补课能提高成绩;也不能看有些孩子从小参加各种课外活动、长大后成了成功人士,就认为那些素质教育有利于成功。那也许只不过是因为爱学习的孩子才爱补课,富裕的家庭才有条件让孩子去学击剑和马术,他们的成功只是个人能力和家庭能力的外溢。
✵
第四类叫「 门槛偏差 (Threshold Bias)」,也叫「 伯克森悖论 (Berkson’s Paradox)」[9]。这里的问题是你看到的都是跨过某个门槛之后的样本。
有一些民间智慧说:
- 长得帅的男人都是渣男。
- 美女通常脾气差。
- 业务能力强的人情商低。
- 体育好的学生文化课差,文化课好的学生体育差。
难道说老天爷讲公平,给人一个优点就必定再给他一个缺点吗?其实这些统统都是错觉。
两个原本可能完全不相关的变量,如果你非得把它们加在一起,设定一个总的门槛,然后只看那些越过门槛的样本,你就会发现这两个变量显得负相关 [10]。
就拿婚恋市场来说,我们假设女生最看重的两项男生价值一个是长得帅,一个是人品好,能两者兼具就更好,但决不能又丑又渣。你默默地设定,男性的综合吸引力 = 颜值 + 人品,给每人都计算了一个总分。
一个男生哪怕想要成为你的备胎,他的总分也得越过一个门槛。那你可以想见,门槛里边的人两项都是高分的肯定是少数,大多数人必定是一项分高,一项分低 —— 于是你发现颜值和人品是互斥的。
其实这一切只不过是因为那些又帅又专一的男生本来就少,而且早被人抢走了,而又丑又渣的男生根本就没有成为你的样本。

同样道理,为什么业务能力强的人情商低?因为公司招的都是”业务 + 情商”超过一定门槛的人。两项都强的是极少数,两项都弱的进不来,剩下你容易看见的,就必定是一项强、一项弱的那些。
相亲不是人口普查,招聘不是社会抽样,门槛会制造对立,筛子会伪造规律。
✵
选择偏差是因为样本有问题。但有时候就算样本没问题,你的眼睛还可能出问题。你可能只注意极端的案例而对那些平凡的事物视而不见;你可能只愿意看见支持自己观点的证据 —— 这些现象被称作「可得性偏误(Availability Bias)」和「确认偏误(Confirmation Bias)」,我们这里不必细说。
想要在真实世界中获得一点真知,那是非常困难的。
科学家为了对付选择偏差费尽了力气。最理想的办法是把人随机分组做实验。但如果你不能做实验,只能被动统计现成的结果,你就必须得确保样本是干净的 —— 其中最重要的就是去追踪那些没有出现的人。他们可能是因为失败而退出了游戏,但他们的参与仍然很有意义:他们可以贡献知识。
我们听说任何故事,总可以先问四句话:谁没来?谁来不了?分组是随机的吗?这里有没有门槛?
如果你听说了很多坏消息,请提醒自己真实世界可能比你想的要好一点。对于老百姓的日常经验,也请提醒自己,人有多么容易陷入偏差。
正所谓:
灯下看人皆匆忙,
瀑前观水势奔狂。
若问世间真面目,
先寻沉默与退场。

注释
[1] Chou, Hui-Tzu Grace, and Nicholas Edge. “They Are Happier and Having Better Lives Than I Am.” Cyberpsychology, Behavior, and Social Networking 15, no. 2 (2012): 117–121.
[2] Hunt, Melissa G., et al. “No More FOMO: Limiting Social Media Decreases Loneliness and Depression.” Journal of Social and Clinical Psychology 37, no. 10 (2018): 751–768.
[3] Hu, Nan, Paul A. Pavlou, and Jie Zhang. “Why Do Online Product Reviews Have a J-Shaped Distribution? Overcoming Biases in Online Word-of-Mouth Communication.” 2009.
[4] Azoulay, Pierre, Benjamin F. Jones, J. Daniel Kim, and Javier Miranda. 2020. “Age and High-Growth Entrepreneurship.” American Economic Review: Insights 2 (1): 65–82.
[5] Elton, Edwin J., Martin J. Gruber, and Christopher R. Blake. 1996. “Survivorship Bias and Mutual Fund Performance.” Review of Financial Studies 9 (4): 1097–1120;Carhart, Mark M., Jennifer N. Carpenter, Anthony W. Lynch, and David K. Musto. 2002. “Mutual Fund Survivorship.” Review of Financial Studies 15 (5): 1439–1463.
[6] Arrighi, H. Michael, and Irva Hertz-Picciotto. 1994. “The Evolving Concept of the Healthy Worker Survivor Effect.” Epidemiology 5 (2): 189–196.
[7] 《精英日课》第五季, 乡愁愁什么愁 ;Johan Norberg, Open: The Story of Human Progress, Atlantic Books, 2020.
[8] Dale, Stacy Berg, and Alan B. Krueger. “Estimating the payoff to attending a more selective college: An application of selection on observables and unobservables.” The Quarterly Journal of Economics 117.4 (2002): 1491-1527.
[9] 《精英日课》第四季, 伯克森悖论
[10] Westreich, Daniel. “Berkson’s Bias, Selection Bias, and Missing Data.” Epidemiology 23, no. 1 (2012): 159–164.
划重点
1.选择偏差:进入你视野的样本,并不等概率代表真实世界。 2.四类典型偏差: - 自我选择偏差:就如同开一场 party,来参加的人,都是自己*想要*来参加的。 - 幸存者偏差:没来的人不是因为没兴趣,而是因为根本来不了。 - 分组选拔偏差:问题出在事物一开始的分配环节:它根本就不是随机分组的。 - 门槛偏差,也叫「伯克森悖论」:你看到的都是跨过某个门槛之后的样本。