一句话总结
学习的本质是把世界压缩成一套能预测、能解释、能干预、还能自我纠错的内在地图——地图分四层:表征(地名)→ 图式(模板)→ 心智模型(机制)→ 解释框架(全图)。
核心论点
- 故事 ≠ 知识。故事/经验/景点印象给你的是「信息」(对特定不确定性的一次性克服),不是「知识」(通用操作方法)。“授人以鱼”与”授人以渔”的区别。
- 学习即压缩(纳夫塔利·提斯比 的 信息瓶颈理论,1999/2000):人脑和深度神经网络的学习本质都不是记忆而是压缩。带走的规律越简洁、解释力越强,知识就越高级。这与 理解即压缩 / 最小描述长度 / 奥卡姆剃刀 是同一主张的不同表达。
- 四层知识结构(从低到高,本讲核心工具):
- 表征 (Representation):现实事物在头脑中的代用品;认知地图的最小单位;对应概念、名词、对象、关系、边界。你思考的不是真实世界,而是表征。
- 图式 (Schema):表征聚合成的”模式识别模板”;让你”一块一块”看而不是”一个一个”看;脑补能力的来源;弗雷德里克·巴特莱特 1932 提出,让·皮亚杰 发扬。
- 心智模型 (Mental Models):会动的图式;有变量、因果、反馈、边界条件,允许推演;肯尼希·克雷克 1943 提出。回答”它怎么运转”——一般图式只回答”这是什么”。万维钢明示:本课程所谓「思维工具」就是一个个心智模型。
- 解释框架 (Explanatory Framework):万维钢自创术语;某派学者对一个领域的系统性看法;范围比库恩的「范式」小,是”一家之言”。
- 把一本书”从厚读到薄”= 提取这四种结构;“从薄读到厚”= 学以致用、举一反三。读书/上课不要再问”讲了什么”,要问”能拿走什么结构”。
- AI 时代极端案例:2026 年 3 月,MIT 一研究生借 NotebookLM 把一学期课程压缩到 48 小时通过。方法是问 AI 两个问题:(1) 这个领域每个专家都具备的五大核心心智模型是什么?(2) 这个领域三个最大的争议点,正反方最有力的论点是什么?——分别对应心智模型和解释框架两层。然后让 AI 出 10 题做自我测试 + 错题倒逼读原著。
- 万维钢自己仍倾向慢学(理解+灵活运用需要细节),但承认 MIT 这位是”真学,他知道学习学的是什么”。
关键概念
四层结构:
其他关键概念:
- 信息瓶颈理论(Tishby)
- 理解即压缩(本讲框架为”学习即压缩”)
- 范式(Kuhn)
- 第一性原理(作为心智模型的典型例子)
- 信息价值(开篇引用)
- 马尔可夫毯(“跨越马尔可夫毯进入大脑”)
- 地图不是疆域(“我们操作的不是疆域而是地图”)
引用人物与著作
人物:
- 纳夫塔利·提斯比(Naftali Tishby)—— 信息瓶颈理论 1999/2000
- 弗雷德里克·巴特莱特(Frederic Bartlett)—— 图式概念 1932
- 让·皮亚杰(Jean Piaget)—— 图式概念发扬光大
- 肯尼希·克雷克(Kenneth Craik)—— 心智模型 1943
- 理查德·费曼(Richard Feynman)—— 例:积分号下求导
- 查理·芒格(Charlie Munger)—— 八九十个心智模型大合集
- 埃隆·马斯克(Elon Musk)—— 第一性原理作为心智模型
- 托马斯·库恩(Thomas Kuhn)—— 范式(与解释框架对照)
- 秦晖 —— 《秦汉史讲义》作为解释框架样本
著作:
- Remembering(Bartlett 1932)
- The Nature of Explanation(Craik 1943)
- 秦汉史讲义(秦晖 2024)
- 科学革命的结构(Kuhn)
- 现代思维工具100讲(本课程)
与其他课程的连接
- 信息价值:怎样区分沙子和金子 —— 开篇直接化用”信息价值”概念论证”知识 ≠ 信息”
- 认知负荷理论:因为文具多,所以是差生 / ICAP 框架:最高效的学习方法 / 主动高认知负荷:注意力的 Pro 模式 / 刻意练习:天赋的作用究竟是什么 —— 学习方法序列同板块;本讲是”学什么”维度的元层级。
- 颗粒度和因果中介:用模型思考 —— 那一讲讲”因果模型”,本讲说心智模型”更大”,包含因果模型;两者是同一族概念的不同放大倍数。
- 叙事:这个宇宙的第一性原理 —— “我们理解的不是历史本身,而是某种历史叙事”——本讲为 叙事 提供了认知机制层面的支撑(叙事 = 一种解释框架)。
- 自由能原理:活着就是对齐 —— “把世界压缩成内在地图”与自由能原理的”最小化预测误差”是同一过程的两种语言。
我的反应
(留空,待用户填写)
原文
来源:https://www.dedao.cn/course/article?id=qavDm012GolV7OYAjxVxPjEy8zdk73 出处:现代思维工具100讲 · 14分14秒 转述:怀沙AI
你面前有两本历史书:一本讲的是赵匡胤打天下的传奇故事,另一本讲的是北宋的政治斗争模式,你知不知道哪本更值得读?
可能有些人认为所有知识都是平等的,这两本书同样有价值,我坚决反对。我认为后一本比前一本更值得你花时间认真学习。
我们前面讲过「信息价值」:只有当一条信息能够改变你的实际行动时,它才有价值。连信息跟信息都不平等,知识跟知识怎么能平等呢?
可能你一年读五十本书,笔记记得密密麻麻,每天还要刷文章、听播客,看到一个冷门知识点就赶紧收藏……你以知道的事儿多为荣,能在饭局上从地缘政治扯到量子力学。博学可能给你带来了精神享受,但是用处不大。
遇到事儿,你还是不知道怎么决策;面对新闻,你看不清其中的脉络。人家问你中国经济怎么回事,你能列举三个经济学家的观点,听起来互相矛盾可是你不敢拿主意到底谁对谁错。问你还不如问 AI,甚至不如问搜索引擎。
世人多被应试教育蒙蔽,把学习当成死记硬背”知识点”,不知道学习真正的价值,更没有学习的章法。
这一讲的思维工具由四个你们高中老师没听说过的概念组成: 表征、图式、心智模型和解释框架。它们构成了真正学习的四个层级。
✵
我先说说为什么听历史故事不叫学习,哪怕那个故事是真的。故事也好、旅游中对景点的印象也好、老师傅干了二十年工作的经验也好,给你的都是「信息」,不是「知识」。
信息是对不确定性的克服。本来你不知道这片地下面有没有石油,现在我告诉你一个信息,你知道了。这个信息很有价值,但它不是知识 —— 因为你没有从中学到任何技能:下次换一个地方,你还是无法判断那里有没有石油。
信息是”授人以鱼”,而知识是”授人以渔”。知识是一种通用的操作方法。有了知识,你换到别的地方还能得到鱼。
你可能说,知识是不是比信息复杂得多?其实不是。知识追求的不是复杂,而是简单。捕鱼人今天早上吃的什么饭,用的鱼竿是什么牌子,鱼饵花多少钱买的,甚至他跟他老婆是不是正在闹矛盾……这些信息可能对一个完整的故事很重要,但对于你学习捕鱼知识来说,没有任何价值。学知识,我们必须把琐碎无关的信息都忽略掉,提取出通用结构来。
耶路撒冷希伯来大学的计算机科学和神经科学教授纳夫塔利·提斯比(Naftali Tishby)在 2000 年前后提出一个「信息瓶颈理论(Information Bottleneck Theory)」[1],认为不管是人类大脑还是深度神经网络,学习的本质不是记忆,而是「压缩(Compression)」。
学习即压缩。我们要的是规律,而不是细节。你从这本书里带走的规律越简洁、越能解释复杂现象,你的压缩率就越高,你的知识就越高级。
讲规律的书比讲故事的书高级多了。有人靠评书演义总结了一套市侩官场斗争哲学,到现场一看根本不是这么回事;学者从无数史实中提取、推演、论证了一套规则,那才是真东西,读这种书才有高杠杆。故事书充其量只能作为喂养规律书的语料而已。
但规律不是一维线性的东西,它有分层的结构,咱们从低到高,一层一层往上说。
✵
第一层是「表征(Representation)」。表征是现实世界中的各种事物在人的头脑中的代用品。
比如”苹果”这个词就是一个表征。真实的苹果是一堆原子,而你脑子里的苹果则是一个红色的、圆形的、甜的东西。
现代认知心理学认为,我们的大脑无法处理真实世界本身 —— 当我们在大脑里想象和思考真实世界的时候,我们想的都是各种表征 [2]。换句话说,一个事物要想跨越马尔可夫毯进入我们的大脑,它就必须得先有表征才行。
你思考的不是真正的经济活动,你思考的是那些经济学概念和指标。你理解的不是历史本身,而是某种历史叙事。我们在大脑中操作的不是疆域,而是地图。
表征就是认知地图的最小单位,一般对应知识里的概念、名词、对象、关系和边界。那么接触一个新领域,就不是把书里那些句子背下来,而是从中提取关键的表征:这里的核心概念都有哪些?最重要变量是什么?它们互相之间有什么样的关系?
抓住这些表征,最好再动手把它们画成关系图,你就会有一个初步的认知,才算是入门了。
有了表征,你就点亮了地图上的地名。
✵
第二层是「图式(Schema)」。 我们前面刚讲过「图式」这个概念。简单说, 如果表征是认知的单个细胞,图式就是细胞聚合成的组织,比如说一块肌肉。
图式这个概念最早由英国心理学家弗雷德里克·巴特莱特(Frederic Bartlett)在 1932 年提出来的 [3],后来被发展心理学家让·皮亚杰(Jean Piaget)发扬光大。
如果说表征是乐高积木里的一块零件,那么图式就是用一堆零件组成的一个可识别的结构:你一看,就知道这搭的就是一个赛车的底盘。如果你熟悉这个图式,你会想到下一步该往上安装轮子了。图式是「模式识别」的模板。
脑子里有图式的人,看事情是一块一块看、而不是一个一个元素单独看的。你一听要写”学术论文”,就知道大概会有问题、方法、实验结果和讨论这些段落;你一听有人要”创业”,就知道接下来是价值主张、融资叙事和组织扩张。
不会下棋的人看见的是棋盘上一堆散落的棋子,职业棋手看见的却是一块一块的局面;局外人听到的是枯燥的发言;懂戏的人一听就知道这唱的是哪一出。
图式能让你迅速识别局面,因为你可以”脑补”。
巴特莱特做过一个著名的实验:给一群英国人讲一个印第安神话故事,故事里原本有很多印第安文化特有的、不符合英国逻辑的细节。结果发现,当英国人在回忆这个故事的时候,会不自觉地把那些奇怪的细节修改掉,或者干脆用英国式的逻辑去补全。
脑补不是坏事。正是因为我们能从一个叙事中抽象出图式来,再把这个图式填充细节用于其他叙事,我们才能举一反三。比如你只要知道了”平台经济”这个图式,你眼中的淘宝、美团和滴滴本质上就是一回事。
图式极大地节省了我们的认知带宽。这就是为什么有一定基础的学生学新东西更快,读过很多书的人读书速度快。脑子里没有图式的人看什么剧情都新鲜;图式多的人看什么都是套路。
✵
第三层是「心智模型(Mental Models)」。这大约相当于器官,因为它能动,还有自身的行为逻辑。 其实心智模型也是一种图式,那些”会动的图式”就叫作心智模型。
心智模型这个词最早是苏格兰心理学家肯尼希·克雷克(Kenneth Craik)在 1943 年提出来的 [4]。它的意思是大脑中构建的一个微型模型,用来模拟现实。
简单说,心智模型有特定功能,它的内部有变量,有因果,有反馈,有边界条件,所以它允许你做推演:如果你做了 A,那么 B 就会发生。一般的图式回答”这是什么”,心智模型则能进一步回答”它怎么运转”。
一个描写事物如何运行的完整理论就是一个心智模型,比如万有引力定律就是一个心智模型。我们这个课程所谓的「思维工具」,也是一个个心智模型,只不过我们强调它们是可以拿来使用的而已。心智模型比我们前面讲决策的时候说的那种「因果模型」更”大”,因为它内涵更丰富,不是一事一议,可以迁移到不同的情境之中。
掌握心智模型,而不只是听说几个概念和谈论什么局面,你才算得上真正学会了一个什么东西。
物理学家理查德·费曼(Richard Feynman)读书的时候,在同学中以微积分高手闻名。常常有些积分题连数学系的博士生都不会做,费曼三下两下就能给解出来。那费曼是怎么做的呢?原来他深入研读了一本旧的《高级微积分》,从中掌握了一种正统课程中很少讲授的微妙技巧:在积分号下求导 [5]。
费曼这个绝招就是一个心智模型。他非常理解这一招的原理,所以他能灵活运用到不同的题目之中去。
「心智模型」在硅谷、在商界是个很流行的词。马斯克招牌式的”第一性原理” [6],就是一个心智模型。查理·芒格(Charlie Munger)更是直接搞了个心智模型大合集,涉及数学、物理学、生物学、心理学、微观经济学等多个领域,总共八九十个心智模型 [7]。直到现在这些模型在网上依然被人们津津乐道。
我们上课、读书、做研究最根本的目的,不是搜集什么”知识点”,而是提取材料背后的心智模型:它是怎么运作的?这里面最重要的变量是什么?输入是什么?输出是什么?谁影响谁,机制链条怎么走?有什么反馈、延迟和副作用?这个模型的失效边界又在哪里?
✵
学习的第四层,也是最高一层,叫「解释框架(Explanatory Framework)」。 这个词是我发明的,关于这一层学术界没有什么标准的说法 [8]。解释框架的意思是:当前学界的某一派意见,对一个领域的整个系统性看法。
一个解释框架就是一个领域的全图,它包含若干个心智模型和图式,它提供了思考一个领域所有关键问题的表征,它说的是这一大类现象应该如何解释。
我举个例子,秦晖先生 2024 年出版的《秦汉史讲义》一书,就是关于”帝制中国”的一个解释框架。这本书说的不只是秦汉史,甚至不只是历史。书中梳理了经济、政治、管理、社会和文化的逻辑。读了这本书,你就能理解帝制中国为什么会有那样的财政结构、政治结构和社会关系,你还能知道法家、儒家和道家在中国历史中实际的生态位是怎么回事儿。
当然我不敢说一本《秦汉史讲义》能说尽古代中国,其他学者对中国还有别的解释框架。每个学科都有很多很多种由当代学者写的解释框架类的书。相对于把《二十四史》从头到尾读上多少遍来说,读解释框架能让你事半功倍。
摸到解释框架,你才开始像学者那样理解世界:不是追故事,而是问机制;不是摆立场,而是比解释力和判断力。
✵
所以学习学的是什么呢? 学的是把世界压缩成一套能预测、能解释、能干预、还能自我纠错的内在地图 ——
- 组成地图的材料叫「表征」;
- 常用的快速模板叫「图式」;
- 能跑起来的机制图叫「心智模型」;
- 对全局的系统性理解,是「解释框架」。
所谓把一本书”从厚读到薄”,就是抛开不重要的信息,提取其中的关键表征、图式、心智模型和解释框架这四种东西;而所谓把书再”从薄读到厚”,不是说让你再去纠结和补充各种细节,而是说在你真正学会了这张”内在地图”之后,就能学以致用、举一反三:遇到任何相关场景,你都能把这几样东西拿出来从容应对,随时生成新的内容。
所以以后读书、上课、看论文、分析文章,不要再问”这篇讲了什么”,要问你能从这里拿走什么结构。表征只是术语表;学到图式,你才能看出点门道;拿到心智模型,你才算是会使用这里的知识;掌握解释框架,你就能判断什么值得相信、什么只是叙事包装。

✵
最后咱们说个有点极端的案例,看看 AI 时代最高效的学习法是什么样的。
2026 年 3 月,X 上一个哥们儿报道 [9],麻省理工学院有个研究生,借助 NotebookLM —— 这是 Google 的一个 AI 应用 —— 把一门课程一学期的学习量压缩到了 48 小时。他从来没去上过那门课,他总共就学习了这 48 小时,然后他通过了那门课的考试。
那你说是不是把课程的教材上传给 AI,让 AI 帮助你总结、对你提问呢?没有这么简单。这位研究生做的其实比一般学生还要多。
他把这门课 6 个不同版本的教材、15 篇研究论文以及所有能找到的课堂记录,一股脑上传到 NotebookLM,然后问了 AI 两个问题:
第一,这个领域内每个专家都具备的五大核心心智模型是什么?
第二,告诉我这个领域内三个最大的争议点,争论双方各自最有力的论点是什么?
用我们这一讲的视角看,第一个问题问的是心智模型,第二个问题就是在摸索解释框架。
搞懂了这 5 个心智模型和 3 个争议点,这位研究生又让 AI 生成 10 个问题来测试他。他针对其中每一个问题,都去原著里找答案,倒逼自己带着问题读书。如果答错了,他就会让 AI 解释他为什么错了、他错过了什么。这些就是在精细打磨自己头脑中的模型。
就这样 48 小时之后,他已经可以跟导师对话了。
其实我反对突击学习。如果你学得太快,哪怕全理解了,也会很快忘掉。学慢一点,多了解一些细节,有助于你加深理解和灵活运用……但是这位研究生可不是在搞应试教育。他是在真学,他知道学习学的是什么。
如果你没下过这个功夫,哪怕你花了 10 倍的时间,也应该问一问自己到底抓没抓住真东西。

[GPT 按照这一讲的思路总结的学习逻辑图,可惜它处理中文仍然有问题。]

注释
[1] Tishby, Naftali, Fernando C. Pereira, and William Bialek. 1999/2000. “The Information Bottleneck Method.”
[2] Pitt, David. 2023. “Mental Representation.” The Stanford Encyclopedia of Philosophy.
[3] Bartlett, Frederic C. 1932. Remembering: A Study in Experimental and Social Psychology.
[4] Craik, Kenneth J. W. 1943. The Nature of Explanation.
[5] Goldmakher, Leo. 2021. “Differentiation Under the Integral Sign.”
[6] 《精英日课》第四季, 像火箭科学家一样思考2:马斯克为什么能用第一性原理?
[7] Munger, Charlie. 1994/1995. “A Lesson on Elementary, Worldly Wisdom As It Relates to Investment Management & Business.”
[8] 你要是强行联系的话,「解释框架」有点像托马斯·库恩(Thomas Kuhn)在《科学革命的结构》一书中说的那个「范式(Paradigm)」,意思是被科学共同体集体默认的、决定了”什么样的问题值得研究”以及”什么样的解释才算科学”的底层认知法典 —— 但我这里的意思比范式要小很多,可以是一个学者对于一个领域的系统性看法,可以是一家之言。
[9] Ali, Ihtesham. 2026. X post, https://x.com/ihtesham2005/status/2030214970353602806 March 7. 原贴没有透露那个研究生的名字。
划重点
- 表征、图式、心智模型和解释框架,它们构成了真正学习的四个层级。
- 学习即压缩。我们要的是规律,而不是细节。你从这本书里带走的规律越简洁、越能解释复杂现象,你的压缩率就越高,你的知识就越高级。
- 学习学的是把世界压缩成一套能预测、能解释、能干预、还能自我纠错的内在地图:组成地图的材料叫「表征」;常用的快速模板叫「图式」;能跑起来的机制图叫「心智模型」;对全局的系统性理解,是「解释框架」。