一句话定义

进入你视野的样本,并不等概率代表真实世界——就算无人说谎,你看到的也不是真实世界。

来源

详细解释

你以为你在观察整个大海,殊不知你只是在看渔网里捞上来的鱼——网眼大小、下网位置早就决定了你看到什么。学术界发现十几种选择偏差,万维钢粗略归为四类:

  1. 自我选择偏差 (Self-selection Bias):来参加 party 的都是想要来的人。典型案例:朋友圈悖论、网络评论的 J 型分布、热搜的极端事件。
  2. 幸存者偏差 (Survivorship Bias):没来的人不是没兴趣,而是根本来不了。商业世界最致命的认知陷阱——会让你总结错误的成功经验(创业辍学叙事、基金历史收益、健身偏方、健康工人幸存效应、怀旧)。
  3. 分组选拔偏差 (Sorting Bias):分配环节本身就不是随机的。最反常识案例:名校效应——名校更像筛选器而不是炼丹炉(Dale & Krueger 2002)。
  4. 门槛偏差 (Threshold Bias) / 伯克森悖论 (Berkson’s Paradox):你看到的都是跨过某个门槛后的样本——两个原本不相关的变量加和设门槛,门槛内样本就显得负相关。“长得帅的男人都是渣男”统统是门槛伪造的规律。

科学家应对选择偏差的最佳办法:随机分组实验。如果只能被动统计,就必须追踪那些没出现的人。

「四问诊断法」:①谁没来?谁来不了?分组是随机的吗?这里有没有门槛?

可得性偏差 / 确认偏误 互补:选择偏差是样本有问题,那两个是眼睛有问题。

万维钢小结:「社交媒体不是生活,评论区不是民意,热搜不是人间。」

相关概念

相关工具

  • 参考类预测 — 用分布信息打破被幸存者样本支配的直觉

出现在