一句话定义

约翰·吉廷斯 1979 年提出的最优”打老虎机”算法:给每个选项算一个指数,每步都拉指数最高的——本质上是把”剩余时间”折扣到当下做权衡。

来源

详细解释

  • 数学上把无限维的 多臂老虎机问题 简化成一组独立的单臂问题——每个臂只需要算一个指数(即”当前估值”+ “信息价值”的折扣组合)。
  • 核心精神:对未来的利用要有折扣。剩余时间长 → 探索价值高(一旦中大奖能利用很久);剩余时间短 → 减少探索增加利用。
  • 应用到人生:80 岁不再探索新就业是合理的;30 岁就说”我太老了” 是对吉廷斯指数的侮辱(还有三四十年职业生涯)。
  • 万维钢的延伸:临终阶段虽然 GI 要求停止探索,但满足好奇心本身就是享受——可以”反 GI”地保持探索。
  • 严格使用要查数学表格或现场计算,但精神远比公式重要。

相关概念

相关工具

出现在