为什么伟大不能被计划（Kenneth Stanley & Joel Lehman）

1. 核心问题 + 挠痒处

Stanley 和 Lehman 是进化算法研究者，2008-2010 年在做一件奇怪的事——用神经进化算法跑机器人走路、机械臂操控、艺术生成。他们发现一件反直觉的事：明确的目标函数（fitness function）经常让算法卡在局部最优；放弃目标、纯粹追求「与已知的差异」（novelty search）反而能爬出局部最优。

他们对主流的不满很具体——商业、教育、科学界都默认「设定明确目标 → 朝目标优化 → 达成目标」是高效路径。但 Stanley 看见的数据是：高目标导向在简单空间有用（迷宫小、路径短），在复杂空间（多重峰、欺骗性梯度）灾难性。

不写不行的那股劲儿——他们要把这个反直觉的实验证据扩展成一个论点：目标越雄心勃勃，目标函数越是误导你。这一刀切在硅谷的 OKR 文化、教育的考试主义、科学的 NSF grant 系统。

2. 基础假设

五条天花板，不证，摆桌上：

复杂创造的搜索空间是欺骗性的——「看起来更近」常常是「实际更远」
伟大成就的路径几乎从不经过看起来通往它的点
明确目标在简单空间有效，在复杂空间灾难
「与已知的差异」是比「与目标的距离」更可靠的搜索信号
垫脚石的价值常常事后才能识别

3. 分析框架

一句话：Novelty search > Objective search。新奇性搜索胜过目标搜索。

Stanley 的取景框：把任何创新、发现、伟大成就的搜索过程，重新理解为「在巨大的可能性空间中寻找垫脚石的旅程」——不知道垫脚石通向哪里，但每一块都让你够到下一块。

他们的独占术语和区分——

Objective Paradox：目标越明确，欺骗性越强。直觉的「朝目标爬坡」在欺骗性景观里把你困在局部最优。

Novelty Search：放弃目标函数，改为「最大化与已知行为的差异」。Stanley 用进化算法实验证明：迷宫导航任务中，novelty search 平均比 objective search 解决率高 10x。

Stepping stones（垫脚石）：通往任何复杂成就的中间步骤，事先无法识别为「通往那里」的。真空管 → 晶体管 → 集成电路 → 微处理器 → 互联网 → 移动 → AI——每一步在发明时都不是「为了创造下一步」。

Deceptiveness（欺骗性）：搜索空间的内在性质，不是错觉。某些空间的几何让「最优局部步骤」系统性地远离全局最优。

Treasure hunter vs Goal-driven explorer：宝藏猎人不知道宝藏在哪，只知道哪里值得挖；目标导向者知道目标但不知道怎么去。复杂空间属于前者。

Interestingness as compass：当目标不可靠时，「这件事有趣」是更可靠的搜索信号。有趣 = 与已知有差异 + 可继续探索。

4. 核心观点 / 结论

目标导向的搜索在欺骗性空间里会持续把人困在局部最优。真正的突破来自放弃目标、追逐新奇性——让无数看似无关的「垫脚石」自发涌现出你事先无法想象的结果。

更狠一刀：这不只是搜索算法的实验结果。Picasso 没设定「成为现代艺术之父」的目标，他在追逐当下让他兴奋的实验；Wright 兄弟没设定「发明客机产业」，他们在追逐让风筝稳定的几何；甚至 Apple 的 Macintosh 没诞生于「占领个人电脑市场」的 OKR，它诞生于 Xerox PARC 一群没目标的工程师对图形界面的好奇。

再更狠：现代制度（科研基金、教育、企业 KPI）系统性地选择 objective-driven 路径，因为它「看起来理性」。这种系统性偏好正在压制 novelty search，导致整个社会的探索能力在下降——你拿不到钱做没有明确目标的研究。

带走的一句——

The greatest things in life are never reached by trying to reach them.

5. 精神内核 — 带走一件

形态：取景框

内容：核心是「欺骗性空间」（deceptive landscape）——某些搜索空间的几何让「最优的局部下一步」系统性地远离全局最优。在这种空间里，目标函数不是导航，是诱饵：你越朝它爬，越被困在局部最优。Stanley 的替代不是「更努力」，是 novelty search——放弃目标，改为最大化「与已知的差异」，让事先无法识别的「垫脚石」自发涌现。判断一件事用哪套策略，先问：这个空间是不是欺骗性的？

为什么是这一件：换上这副眼镜，你看 OKR、创业规划、科研路线图、应试教育，全是 objective search 在欺骗性空间里的失败模式——朝着「看起来更近」的点爬，恰好爬不到伟大。看自己的人生规划，先问「我现在追的目标，是导航还是诱饵？这空间是不是欺骗性的——最近让我兴奋的事，会不会才是真正的垫脚石？」十年后还在用的取景框，翻回原书是想再校准一次「interestingness 作为指南针」的精度。

走一步：把这台框挪到「该不该读一个看起来没用的专业 / 跳进一个没前途的小众领域」。预测：在欺骗性空间里，「看起来没用」恰恰是垫脚石的标准长相——Stanley 会说别用「离目标多近」筛它，用「它够不够新、能不能让你够到下一块石头」筛。能这样预判，才算把这台框拿在手里。

带走了这一件，这本书的精神内核就在你手里。

6. 取景框上手 — 把欺骗性空间画成一张能走的寻宝图

前五段把骨架摆出来了。现在把第 3 段那台框——欺骗性空间 + 新奇性搜索——画成一张图，让你不光看懂 Stanley，还能拿他这张图去预测他没写过的事。

一、画地图。Stanley 这张图，是一片起伏的山地。坐标系两根轴：横轴是「与已知的差异」（越往右越新奇），纵轴是「与目标的距离」（越往上看起来离目标越近）。麻烦就出在这张地形本身是欺骗性的——通往最高峰的路，几乎从不经过那些「看起来更高」的山头，而是要先下到山谷、绕到一片看不出名堂的荒地，才够得到通往真正高峰的垫脚石。这张图能整张借给别处——它其实就是「寻宝图 vs 地图」之别：有终点坐标的地图只在平原管用；一进复杂山地，你手里只能是一张寻宝猎人的图，上面没标宝藏在哪，只标「哪块石头值得踩上去看看」。

二、标位置。新奇性搜索、垫脚石、欺骗性不是三个并排的概念，是这张图上彼此拉扯的几个点。欺骗性是地形本身的褶皱（主轴）；目标函数（OKR、DCF、科研路线图）站在纵轴上，只奖励「看起来更近」，于是把人一路推上最近的小山头——局部最优，再也下不来。novelty search 换了把尺：不量「离目标多近」，量「离已知多远」，于是逼着你离开已踩平的山头、往荒地走。垫脚石就是荒地里那些事先看不出用处、事后才发现「原来踩着它才够到下一块」的石头。位置一标出来就看明白了：OKR 不是没用，是只在平原管用；一进欺骗性山地，它就从导航变成诱饵。

三、走两步，做预测。挪到 Stanley 没去过的地方，用他的图猜一把再对账。挪到「大学选专业」：一个孩子嘴上要「进大厂拿高薪」（目标在纵轴顶），于是只挑「看起来离大厂最近」的热门专业。图预测：在欺骗性的就业空间里，热门即拥挤即局部最优——四年后红海里卷生卷死。而真正的大机会，往往来自当年「看起来没用」的冷门交叉地带（统计学+生物→今天的计算生物，当年没人觉得近）。对一下现实，过去十年最高回报的人才路径，多是当年不被看好的交叉学科——图预测中了。再挪到「公司该不该养一支没有 KPI 的探索团队」：图预测，砍掉它短期财报最好看（省了 9990 个失败 agent 的成本），但等于在欺骗性的技术空间里只走纵轴——三五年后被一个从荒地里冒出来的对手垫脚石超车。对一下——这正是柯达、诺基亚的死法。两步都中，这张图就拿住了。

到这儿，欺骗性空间对你不再是术语，是一张随身的寻宝图。往后看任何一个「该追这个明确目标，还是该跟着好奇心漂一阵」的决定，你会下意识把它摊到图上：我现在站的是平原还是欺骗性山地？我手里这把尺，量的是「离目标多近」还是「离已知多远」？

私货一刀：Stanley 把 interestingness 当成可靠的替代指南针，却没堵两个口子。一是它会被污染——一个被 KPI 训练大的人，「让他兴奋的事」可能本身就是社会塞进来的目标函数，不是真新奇；用这台框前得先问，这股兴奋是我的还是被装进来的。二是 novelty search 会退化成「为新而新」，搜一堆既新又通向虚无的死角——算法靠「新且能走路」的最低门槛兜底，人生里那道门槛是什么，Stanley 没给。没有它，「追逐新奇」和「漫无目的瞎折腾」在操作上分不开。这恰是这台框最该自带的护栏。