一句话定义
贝尔曼 提出的决策准则:不管你过去多烂,也不管你起点在哪,你当下的这个决策,必须能让你在 新状态 下面对未来时拥有最好的出路。
来源
详细解释
“沉没成本不影响最优决策”的数学版。从决策树的任意一个节点出发,最优策略的剩余部分对该节点本身也必须是最优的——这正是把 动态规划 变成可递归求解的关键性质。
实操含义:
- 别问”我之前付出多少”,问”接下来怎么走未来出路最好”。
- 别问”这一步本身值不值”,问”它会把我带到一个什么状态:后面的路是更宽了还是更窄了”。
- 三种 状态杠杆 都是这个原理的具体落地。