专栏名称: 混沌学园

咨询服务

DeepSeek横空出世，为什么伟大不能被计划？

混沌学园 · 公众号 · 学习 · 2025-02-11 19:55

正文

DeepSeek的横空出世，震动全世界，也让我们去重新去思考创新的模式和路径。 DeepSeek 凭什么逆袭，挑战Open AI的霸主地位？

DeepSeek 采用了独特的创新策略：在产品上没有拘泥于行业惯常操作，坚持AGI底层创新，想法设法突围。对员工看能力，而不是看经验；没有KPI考核，没有任务；让每个人有自由发挥的空间和试错的机会，尽可能少的干预和管理。

比起科技大厂层层设计的严密组织架构和目标运营，为什么这样的模式反而能够激发创新？

《为什么伟大不能被计划》的作者肯尼斯·斯坦利写到：

“正是在这片位于已知和未知之间的‘蛮荒’边界地带，我们应该让人类最伟大的头脑进行探索，而不是在最大共识的舒适区‘沉迷享乐’。”

“非目标搜索的更重要启示是，它是一位实力强大的寻宝者。在漫无目标的新奇性搜索中，你不一定能找到心中想要的宝藏，反而可能发现许多意料之外的宝藏，这将使整个过程充满惊喜。”

以下是OpenAI前研究员，人工智能科学家肯尼斯·斯坦利 2023年 7 月在混沌的授课内容，重新发布。

授课老师｜ 肯尼斯·斯坦利（Kenneth Stanley），OpenAI 研究员，人工智能科学家

‍ 目标悖论

很荣幸能跟大家分享、交流。我的研究领域是开放性（open-endedness）机器学习。我们都知道，大多数机器学习算法，往往预设了一个优化目标，达成目标很重要。开放式算法与此不同，这一算法没有终点。它让机器具有无限的潜力和持续的创造力，可以在没有明确目标或终止条件的情况下不断演化和产生新的结果。

那什么才算开放性？什么进程是永远不会停止的？举两个现实世界中我们能体会的例子，它们非常具有启发性。

第一个例子是进化。 从地球上的第一个单细胞开始，它不断分化并创造，经历数亿年甚至十多亿年，创造出了人类等等生物，进化的脚步永远不会停止。

第二个例子是文明。 人类出现后，你会看到思想和文明的迸发，这个过程是宏大的，不可思议的。从火种和车轮一直演变到现在的计算机、空间站，文明不断演化，一直持续到今天。它不会停留在某个具体的目标上，只会持续向前发展。从某些方面来看，文明其实是人类最重要的创造发明。不断再造周围世界的能力，是人类智力的重要组成部分。

我们都是开放性进化的产物，而人类作为产物本身又创造了文明。

在这样的背景下，我想同大家分享一个故事。我们研究人工智能的时候，发现了一个人类根本性缺陷。即“单一的目标导向思维会阻碍创造力和创新”，这对社会而言是一个极其严重的问题。

不仅是机器算法，你会发现人类所做的一切，几乎都是以目标为导向的。但目标在我们处理重大事项时，有时反倒是无用的，无法帮我们实现创新。

举个例子，10多年前我在大学任教时，建立了一个网站Picbreeder。它可以帮助人们“繁衍”图片——用一张图片作为母图片，可以 " 生出 " 与之类似的许多子图片。这个技术和现代的图像生成技术是不同的。

如果你准备在Picbreeder繁衍图片，可以先自选一张图片，这张选中的图片就是下一代图片的父母。你可以转身去忙别的事儿，Picbreeder不需要任何指令就会继续繁衍，到最后，出现的图片可能是一只蝴蝶，一个头骨，甚至是木星。这个过程令人震撼。

我需要向各位解释一个非常重要的机制，它被称为分支（branching）。如果用户确实繁衍出一些有趣的东西，并且通过网站保存这一图像，相当于把图像公开发布。那么其他人就可以把这张图片为起点进行分支演化，也就是用这张图去繁衍，获得新图片。这意味着，在前人的基础上继续发现更多新事物。

这就出现了生物学家口中的不断发展的系统发育。就像一棵生命树，这些生命之树末端的叶子就代表着新的发现，而这些都是以一种看似偶然的方式被发现的。

大家可以看下面这张幻灯片上的图片，为什么会繁衍出现这些图片？我得出了一个惊人的发现。

有些人认为，想最终得到一只热带鸟的图片，只要选择看起来最像热带鸟的斑点，通过繁衍就可以得到想要的结果。但有趣的是，事情不是这样运作的。

如果你想用Picbreeder生成一张热带鸟的图片，肯定会失败，这就是以目标为导向的思维方式。能让我们繁衍出鸟类图片的东西，往往看起来并不像鸟。我们的世界是复杂的，臆断只会导致失败。一些人按照自己的想法去繁衍图片，最终的结果令他们感到沮丧。

那么，如果将它们作为目标来搜索无法成功的话，怎样做才能成功呢？我认为这就是事情变得更加深刻的起点。

再以Picbreeder为例回答这个问题。我用一张外星人脸的图片，繁衍出一辆汽车的图片。

首先有一个非常重要的前提，我最初的想法并不是繁衍出一辆车。当时，我只是看到了是一张像E.T.一样的外星人脸，觉得繁衍这张图片一定很有趣，可以得到更多的外星人面孔。

神奇的事情发生了，通过分支出来的图片，外星人的眼睛开始向下移动，这时我意识到外星人的眼睛正逐渐变成轮子，可能会演化出一辆汽车。

在演化的过程中有两个条件必须成立。首先，必须有人去完成我永远不会做的事（比如繁衍出一张外星人图片，供我选择）；其次，我不能带着目标去做事。只有这样，我才能获得我想要的发现。

让人震惊的是，这种繁衍方式，不是巧合。Picbreeder数据库记录了每一张图片的繁衍过程，记录了每一张热门图片背后的“踏脚石”，我们能够确切地知道每张图片是怎么来的。Picbreeder网站上的大多数热门图片，都有着完全相同的繁衍路径。

这其中蕴含着一个非常奇怪的寓意， 你只有不带目的的寻找才能实现目的。 这与我们的直觉相违背，也与我们对现实生活的认知相悖。

如果这条理论成立，人们就不能通过对目标的寻找来发现任何东西。

实际上，这条理论并不仅仅存在于Picbreeder之中，整个现实世界都是这样运作的，所有的复杂空间都有这个性质，这是一个非常重要的发现。

如果我没有通过外星人的脸发现那辆车，我就永远不可能意识到这一点，也不可能创造出后来的算法，也永远不会写《为什么伟大不能被计划》这本书。

当然，这也是一个可以用来理解“开放性”的例子，因为你永远不会知道，你走出的每一步会带来什么结果。

现在有更多的证据来证明这条理论。例如，这张图片中的蝴蝶和头骨是由随机斑点演化而来，各进行了74次、和90次迭代。但在另一个实验中，我们把生成这些图片当作目标，让15个孩子通过自主选择来生成这些图像，最后经历了3万次演化才得到了目标图像。这个结果是多么的疯狂。

我个人认为，这表明人类在人工智能或机器学习领域的许多基准文化可能已落入歧途。算法的强大力量，并不在于当你真正建立一个目标时，它们做事情的能力；而在于，当你没有设定目标的时候，它们做事情的能力。

如果你的目标是生成一张蝴蝶、头骨照片，这个目标会导致你忽略了这些踏脚石，事实上你更应该关注这些踏脚石，我称之为目标悖论。目标悖论的含义是，即拥有一个目标，会妨碍你实现目标。

这里需要澄清一点， 目标悖论并不是要你没有目标，而是说当你没有目标的时候，更有可能实现创新。 目标只会在简单的、非欺骗性空间里生效，解答容易的问题，有一个适度的目标并没有错。当你放弃目标的时候，你可能会做成伟大的事情，但是你不会提前知道这件事情是什么。

这就是我们面临的选择。

这个世界上，不可能有人在完成一件惊人的事情的同时又有一个目标。我们希望世界能以这种方式运作，但事实并非如此。这不仅是Picbreeder的运作结构，也是现实世界的运作结构。

人类总是在适度的目标中成功完成任务，相信并由此推断这一思维模式对一切都有成效，这是根本错误的。觉得每件事儿都会围绕目标运作，这是人类文化中产生的一种误解。

‍ “新奇式搜索算法”和“发散寻宝”

在发现这一理论的时候，我还在研究计算机科学或者人工智能，对这个发现的兴趣完全是在算法范围内的。我和同事乔尔·雷曼在思考，也许我们可以发明一种新的算法，让它以非常反直觉的方式工作，不设立任何目标，我们称之为 “新奇式搜索算法” 。

举个例子。我们想训练一个两足行走机器人走路，想法是机器人走得越远越能获得奖励。传统机器学习观念认为，必须一小段一小段地走，机器才能学会走路。我们的训练理念是让机器人做一些与此前不同的事情，想法越新奇越好，这种探索未必是正确的，但只要机器人采用了一种新方法，就能获得奖励。

最后实验证明，新训练理念的最好结果要远远优于传统版本，这种违反人类直觉的结果令人震惊。 学会走路的机器人，不一定看起来像在学走路。

新奇式搜索算法催生出了一个新的领域，高质量多样性算法。通过把有趣与高质量目标结合，找到多样性选项中的最佳结果。

在一个非目标导向的世界里，人类的本能之一就是想要追随有趣的事物，因为有趣可以驱动进一步探索。

简单来理解，要想实现最高目标，必须先愿意放弃目标。只有当我们没有真正想着这些目标时，或者当别人没有遵循你所谓的正确的道路以及符合你的利益时，才可能实现目标。

如果人们只做自己认为正确的事，就会忽略掉那些真正能帮你解决问题的“踏脚石”，忽略这些能够奠定伟大基础的东西。就好比，发现一张外星人的面孔，为繁衍出汽车图片奠定了基础。

从目标悖论的角度来看，合作可以导致趋同和共识，但是也将消除通向伟大事物的“踏脚石”。协作的含义是什么？当一群人一起进入一个房间，大家想要达成某种共识，想要找到某种正确的道路，这就导致了多样性的缺失，也带来了妥协。

有时在组织里不达成共识也是很重要的， 人们必须跟随直觉，才能到达某种地点。我称之为发散寻宝。寻宝的人只是随便看，并不知道会找到什么。发散是因为每个人都有不同的方向。

这样的搜索过程没有目标，只是凭直觉在荒野中漫步，去发现有趣的事物。有人会认为我在赞美随机性，并非如此，这一过程还是遵循一定原则的。举个例子，人们在Picbreeder上选择图片不是出于随机，而是出于一定的喜好，而你的喜好一定不是随机的，而是由你的生活经历决定的。

非目标导向的演化过程是非常有趣的，比如Picbreeder和新奇式搜索，进化和文明可以看作是一个发散寻宝的过程，它们也没有最终目标，这才是现实世界的运作方式。

在发散寻宝的过程，收集“踏脚石”仍然是关键。

举个例子，Picbreeder的强大之处在于它运行的时间越长就会出现越多有趣的图像，这意味着我们可以找到更多有趣的事物。这就是踏脚石，这些图片不仅可以用来解决具体问题，还能不断发散、不断繁衍，最终繁衍出一个具有很高价值的宝藏。

DeepSeek横空出世，为什么伟大不能被计划？

正文

请到「今天看啥」查看全文