专栏名称: 字母榜

让未来不止于大

对话Manus肖弘：世界不是线性外推，做博弈中的重要变量

字母榜 · 公众号 · · 2025-03-10 18:16

正文

文 | 张小珺

编辑 | 马龙

转载自 | 腾讯科技（ID:qqtech）

和DeepSeek等从大模型开始构建底层能力的AI公司不同，Manus AI是一家从day 1就只做AI应用的创业公司。

创始人兼CEO肖弘（英文名：Red）出生于1992年，2015年从华中科技大学毕业后，第一段创业是移动互联网to B方向；2022年6月开始第二段AI方向创业，至今快3年。

在创投业内， 很多人认知他是一名“有产品手感的founder” ，而非像梁文锋、杨植麟这样的技术背景创始人。截至目前，Manus母公司蝴蝶效应共完成两轮融资，总规模超过1千万美金，第一轮投资人是真格基金（真格是肖弘上一段创业的天使投资人，他们把从肖弘上个项目赚得的所有资金全部投到他的这个项目中）；第二轮投资人包括红杉中国、腾讯、真格和王慧文。

2023年，在投资人的撮合之下，该公司引入季逸超（原Peak Labs创始人兼CEO，现Manus AI首席科学家）、张涛（原光年之外产品负责人，现Manus AI产品负责人）等核心成员加入。

从去年开始，我对肖弘在不同时期进行了多次谈话， 展开了一场“接力式访谈”。 大模型的模型能力在迅速变化，身处其中的创业者要不断根据外部环境身段柔软地调整姿势。我希望记录一名AI应用创业者，在技术变革之中、当一切都处于不稳定状态下的持续思考历程——而这个历程富有魅力之处就在于，它是变化的，而且还会继续变化。

我们正在开启的2025可能会是AI应用爆发的元年、Agent爆发的元年， Manus打响了国内Agent第一枪。 本次访谈是来自一线“AI应用爆发”、“Agent爆发”的前沿声音。

播客放出来的访谈包含两次：

● 第一次在2024年10月，围绕肖弘第一段创业和第二段创业的第一款产品Monica.im展开；

● 第二次在2025年2月，此时DeepSeek一时改写了中国AI应用底层生态。这次围绕他们的第二款产品、也是新产品（当时还没发布）Manus.im展开。

文字版本重点整理第二次访谈内容： 这款Agent产品Manus诞生背后，创始人的完整思维链展示。

过去两年，肖弘对大模型、产品和创业有一些思考和总结，譬如：

1) “新时代的安迪比尔定律”：模型能力正在外溢，AI应用公司可以吃掉它；

2) 开源一个创业idea：你预判下一个能力是什么，先把这部分应用做好，在前方等着模型能力变强；

3) OpenAI很遗憾，DeepSeek思考展示是整个人类第一次看到，因为OpenAI o1是收费的；

4) 什么产品应该大模型原厂做？什么应该应用公司做？1、垂直领域、特定领域，可能原厂不做；2、脏活累活，可能原厂不做；3、有一些原厂可能以后会做，有窗口期；

5) founder的思维模型，应该“用博弈的方式思考”，而不是“用逻辑推理的方式思考”；

6) 当你意识到你在创新、在领先，应当更激进，超级激进；

7) 今天的中国创业者就应该更激进地全球化。

访谈中，你也能看出， 在技术变革之中、在巨头环绕的AI丛林之中、当地基处于极其不稳固的状态下，一位AI应用创始人的真实的心理状态。

“应该用最疯狂的幻想去理解，”肖弘说，“最好不用做空它。”

肖弘称，他的合伙人季逸超在今年英伟达客户答谢会上，见到了黄仁勋。季问了老黄一个问题：接下来几年，什么事情发生会让你觉得很惊讶？

黄仁勋的回答是：Basically nothing。

（如果大家对他做Manus之前的创业故事也很感兴趣，欢迎收听播客《张小珺Jùn｜商业访谈录》，有很多坦白的表达。）

“新时代的安迪比尔定律”

张小珺：刚刚过去的春节是你们最繁忙的一个春节了？

肖弘： 挺忙的。当然大家已经放假了，但也做了很多沟通，很多同事在工作。

张小珺：春节在憋什么大招？

肖弘： 之前跟你提过的Agent产品在赶着迭代。没想到这个春节 DeepSeek又来一波很火的现象级传播——从各种意义影响都很广泛。讨论，做了很多工作。

张小珺：你们即将要发的Agent产品能不能展开讲讲？

肖弘： 我想分享一个我最近的观察。

我们看到，最开始，ChatGPT之前最火的AI应用是Jasper，然后是ChatGPT，然后是Monica（做浏览器插件）以及豆包之类。接下来Cursor又火了——你会发现AI应用在快速变化，每年都会出现新的AI应用。

我自己就在尝试总结规律，做预测。尽管很多时候依赖少数数据点，描述规律不一定准确，但人类总是习惯去做这样的预测。

我自己感觉，如果我们把这几个应用作为数据点看，是有一些规律的。

比如说Jasper可能大家没用过，他的产品形态是，你要写一个marketing的文章，你要填空——听众是谁，主题是什么——填完之后帮你输出。

ChatGPT是对话式，从填空到对话，更符合直觉。

从ChatGPT到Monica这种自带上下文、自带context的，豆包和夸克都在此范畴—— 不仅是一个Chatbot（聊天机器人），而且是给Chatbot补充了上下文。用户所看到的屏幕里的文章，或者在某个应用里、邮箱里，在用户授权的情况下可以帮他回邮件。就相当于，不单纯是一个Chatbot，而是带上了context的Chatbot。

再往后到Cursor。它火了之后，两个人群在用：一类是工程师，另一类接近产品经理，甚至都不一定是产品经理。举个例子，他在运营公众号，通过Cursor分析公众号数据——这显然不是工程师需求。

他可能也把他当Chatbot用——左边是代码内容，右边是像co-pilot（副驾驶员）区域，他是不会看左边的。写出来代码，有问题也只跟 Chatbot说；他不会说这里有问题，手动改代码。

某种程度上，它也是当Chatbot用，而这个Chatbot跟前面几个Chatbot区别在于：它不仅能对话聊天，带上context，而且当你提出需求，它通过写代码的方式帮你解决这个问题。

我自己看到Cursor的时候 ——当然很多团队应该在往编程这个方向理解，我觉得这当然需要，工程师也是很大群体—— 但我自己把它当普通用户需求在理解。

我看到的这个规律是什么呢？

首先是，越来越符合普通人习惯。从表单到普通对话是更符合普通人习惯的，带上context可以使大家更方便。

比如，你不用像使用ChatGPT一样复制粘贴文章进去，它本身就带着你的context。更早之前也有人用ChatGPT写出代码，把代码再复制粘贴到一个比如Python脚本再去运行，如果有bug还要再把报错报给ChatGPT，ChatGPT写出来代码，再手动合并到代码文件去。这些很繁琐，但Cursor把这个事做得很好。

一个主线，它当然越来越符合人的习惯，而且能力越来越强大，而这种能力的强大是随着LLM能力外溢出来。

Cursor是一家挺早的公司，这个公司成立在2022年甚至更早，它最开始也不是做代码编辑器；而且即便做了代码编辑器，一开始也没火。

它真正为大家所知是2024年7-8月份，因为Claude 3.5 Sonnet发布了。

张小珺：它还是因为一个模型能力的直接提升带来它产品能力的迭代。

肖弘： 对，前面说了那么多，核心我想表达的是什么呢？

模型能力在快速进化，但是“那个壳”也需要进化。

每一代模型能力进化之后，甚至不一定是原厂，是一个第三方厂商把它的用户可感知价值给呈现出来。

如果没有Cursor，我相信Claude 3.5 Sonnet，可能在Claude里面也能写代码，但就不会那么流畅。

我自己总结出来的定律叫做：“新时代的安迪比尔定律”。

（Andy and Bill’s Law，原话是“Andy gives, Bill takes away”/“安迪提供什么，比尔拿走什么”。）

在PC和半导体产业有这个定律——不管Andy Grove造了什么，他是Intel代表，Bill Gates就会吃掉它——Intel因为摩尔定律在，可能18月之后成本下降了、算力上升了，但18月之后Windows也会把它的能力吃掉。可能Windows更图形化，或者提供了更强大能力。

LLM一直在进化。大家看到的模型越来越便宜、越来越强大，强大甚至体现在，原来我们觉得可能简单的写作、回答问题、信息检索。但接下来它会使用工具，它可以写代码，可以调用API。我们最近看到ChatGPT发布了Operator，可以调用浏览器—— 这些都是模型能力正在外溢。

那个“壳”是什么？

原厂肯定在定义，但也需要跟创业者一起定义。Claude是非常好的例子。

大家都知道Monica没有自己做大模型基座。春节假期，我在看一些半导体相关的书——张仲谋的自传。

AMD创办人Jerry Sanders当时有一句话：真男人一定要有晶圆厂！

就是diss那些只有设计能力，但没有芯片制造能力的公司——他说这种公司也太不行了，无法跟我们竞争。

但你看，用张仲谋的话说，台积电创造了两个行业：一个行业是专业的芯片生产制造公司，就是台积电；另一个行业是专业的设计公司。

如果没有台积电出现，那也不存在“设计公司”和“生产公司”分工。

张小珺：你是设计公司。

肖弘： 对。当然我们看产业规律，一般来说，最开始是垂直整合，后面慢慢会有分层。

最开始我们就持有这个观点： 模型应该会普通商品化。

大家现在看到这一点，但这一点，你没有这项能力的人下定论有点危险。因为模型在快速进化。理论上它呈现出来的状态好像不是在普通商品化，因为总有人更厉害一些——但站在更长期的视角，我感觉是的。

我们这家公司的选择是，模型在快速发展，有很多家。更长期视角看，应该不一定叫停滞，而是有若干家进入还不错的水平。在这个时候，单纯做应用可能更简单一点，我们不用投入大量资金训模型。

当然对于有模型的公司，我们是非常尊敬的。 这一波主要进步是他们的创新和努力带来的。但这不是冲突的或者零和的，叫做“做应用”还是“做模型”的问题。

而是，即便是有模型公司在发展，也需要一些主要围绕用户视角、产品视角的公司去做一些工作。不是非此即彼的。

我们跟模型厂的关系都很好。

“开源一个创业idea：

你预判下一个能力是什么，

先把这部分应用做好”

张小珺：你觉得今天的产品定义能力到了一个什么水平？和模型能力比谁更强？

肖弘： 按照刚刚的叙事，所有突破都是模型带来的，就是模型跑得更前面。基本上是模型先驱动、模型先行。

之后你会发现，原厂像ChatGPT，我感觉它在发布时不觉得自己会那么火；包括 DeepSeek在发布时，我相信，这一切不是它预料的—— 原厂基本准备不足。

第二，专业的或者应用厂商，总是在模型先发出来之后，PMF可能才完成。比如Cursor。它这个产品更早有，当时用的可能是OpenAI模型。

张小珺：相当于是先在那里等着模型能力变强。

肖弘： 啊，对！

可以开源一个创业idea：你预判下一个能力是什么，先把这部分应用给好好做好。等着这个能力有了，你就…

你等到那个时候再去做，其实就晚了，对吧？

因为总有一些人，不管是他信仰这个，还是他对foundation model（基座模型）更了解，或者Cursor我就做编程领域。总有些人会去做这个产品。

这也很有意思。你看VC投资难度也变大了——因为当你看到那个产品，因为模型能力不ready，它好像不太work，一用感觉很傻；但等到模型ready，它突然就很厉害了。到那个时候它的商业化做得也比较好。

它的曲线是一个跳变。

张小珺：但是你看，现在模型能力先行，当模型发的时候原厂可能准备不足。作为一个应用公司，你可以在前面等着它，由于它模型能力变强，带来你的爆发式增长。

这个时候原厂，模型掌握自己手里，它可以快速跟进。比如，用跟进策略做一个Cursor类似的产品。

这时候，这两家公司的竞争会如何展开？

肖弘： 今天我们看到所有国内、国外模型公司，都有自己的应用和开放平台的——基本都做了Chatbot和一个开放平台，第三方可以通过API调用它。

这里有个事情是：我们对AGI的理解是什么？它应该还是有公共产品属性的，原厂应该不会什么事都做。

第一，有巨多的事，它不会每个事都做。比如说特定行业的事，一般不会做。

第二，特别辛苦的事，它可能也不会做，或者说需要很多工程师的。

我去Google，看到4:00pm人在遛狗，我觉得他们应该不至于搞100个工程师跟大家卷很具体的应用。

因为对它来说，把壁垒最好的那部分抓在手里就好了，其他事情交给别人去做，对它来说更好。

张小珺：反正可以通过API收钱。

肖弘： 对。

张小珺：所以，（作为AI应用创始人，）不能做最肥的那块业务。

肖弘： 对，但有些当然可能有窗口期——比如长期看它会做，短期还没顾得上——这种事情在今天很考验创业者。有些人选择做，有些人选择不做。

有窗口期的事情要不要做？大家得到的答案不同。

比如在上一场战争，应用商店，后来我们知道会被原厂做对吧？但在那个moment，有第三方应用商店出现，在窗口期从创业角度得到很好结果，也有被并购掉对吧？

但这一次有窗口期的事情怎么做？窗口期内要取得什么样的成绩？去为下一步做什么样的准备？这些是更复杂的问题了。

总结一下——基于API的生意，1、我觉得垂直领域、特定领域的，可能原厂不会做；2、脏活累活，可能原厂不会做；3、有一些原厂可能以后会做，有窗口期。

所谓窗口期复杂就复杂在——也许你做得很好，它就不做了——这不是逻辑推导出来的。

你假定它一定会做，或者它一定不会做，都不一定。有可能真的在生态里面，有一个领头羊做得很好，可能原厂也就不会做了。

今天是非常灵活的，没有确定答案。

对立面是什么？那就是原厂会做的事——Chatbot，看上去大家都是会做的。

“OpenAI很遗憾，

DeepSeek的思考展示

是整个人类第一次看到”

张小珺：为什么大家都要做Chatbot？Chatbot在争什么？

肖弘： 我倒不用争什么的视角看，大家也不是用争什么这个视角。而是它挺符合对AGI的想象——一个对话界面，啥都能干。

大家好像觉得我光做个模型不够，至少得有个Chatbot。

By the way，在所有人中，我感觉DeepSeek对要不要做Chatbot，反而是最佛的。但到今天为止，他却取得最好结果。

张小珺：为什么呢？

肖弘： 首先我说佛，它是在12月份才有自己的App，更早有网页版。你看它的App，会觉得真的“套壳”——只是把模型能力用一个最简单的基础的“壳”展示出来。

张小珺：套自己的“壳”。

肖弘： 另一个角度：如果（DeepSeek）没有做这件事，这次影响和传播不会那么大。因为很多用户是用上了、看到了它的App，看到思考过程，有巨大用户体验提升，又导致大量传播——但这一切是意料之外。

本身这件事肯定非常复杂，有各种各样的原因，中美地缘政治背景，有开源、闭源背景。

我想说的是：我最大感受，这件事情精神上给大家很大鼓励！——从旁观者角度，可能他们也没想给大家鼓励。

今天大家可能也会想，开源火了，要不要开源？要不要构建技术品牌？各种各样的思考。但最重要的是， DeepSeek 一直按自己的节奏在做——Be Yourself！

他一直在开源，前面没火他也在开源，只是在按照自己的节奏做事情。

我记得我们在微信聊天，你问我，如果我是其他几家foundation model公司，我会怎么办？我后来想一下——就是“做自己”最重要，而不是“应激”。

当然foundation model公司创始人们，取得成绩比我们大很多啊。我只是假定，如果我在经营公司，在这种时候最重要的还是按自己节奏来。你会发现简单做好技术，也会得到巨大奖励。尽管这不可复制。

张小珺：能不能讲讲你对DeepSeek这个产品的感受？

肖弘： Perplexity的CEO发了一条推特说，在AI时代有两个巨大体验创新：一是，Perplexity把这句话从引用哪个网页标注出来，增加结果可信度。

二是，把LLM思考过程展示出来。

抛开开源或技术各种指标——我聊了一些老家的朋友，他们能感受到DeepSeek巨大不一样是：DeepSeek把怎么想这个问题的过程展示出来了，这是体验创新。

当然OpenAI o1，也有思考，但 OpenAI很遗憾——DeepSeek的思考过程展示可能是整个人类第一次看到这个事情，因为 OpenAI o1是要收费的！

最近它才把思考过程全部展示出来。它是怕别人可能看到思考过程，有这个数据去做自己的训练。所以它就展示简化版的。说实话，看上去没有太大意思。

首先，因为OpenAI收费，有门槛，很多人根本不知道这回事。

其次，它也没有把思考过程完整展示出来，所以o1错过了体验创新。

DeepSeek思考过程放出来，本身就是巨大体验提升。还联网。o1此前不联网。

还有一点，确实它的模型质量很好。大家原来体验过的基线是普通水平，但DeepSeek新模型，拉到了第一梯队体验。写出的文章就是好很多，聊天更有情商，本身模型能力进化很好，体验上有创新。创新可以很容易被大家感知到，而不是被各种各样的门槛堆起来。

张小珺：OpenAI定义了产品的迭代——第一个是Chatbot（聊天机器人），通过 ChatGPT这个产品，我们知道了Chatbot的用户形态；第二个是Reasoner（推理者），它做了o1，可是没让用户真正感受到技术和产品的链接，反而是从DeepSeek感受到 Reasoner的威力。

还有一点，前段时间我们做了一个播客。去对比阅读DeepSeek-R1和Kimi K1.5的论文，发现Kimi在它的产品体验上刻意让回答变短，而DeepSeek的输出是长的。

以前大家以为从用户定义上输出短更好，但DeepSeek却反直觉，是长更好，大家喜欢看它思考。

肖弘： 对。我们自己最近做Agent产品也有这个感受。

我们要教他：你少用点bullet point（要点总结），不要一点点，太总结了，你就逐字写出来就好了。这个也很神奇。

最开始大家觉得精炼一点会好。当大家发现Chatbot都是精练的输出，就会说，你多讲一讲、我多看一看。

张小珺：总结一下，DeepSeek它不仅是技术强，产品定义也是不错的对吧？

肖弘： 我觉得应该这么说——它把技术上的创新点，以一个用户可感知的方式展示了出来，而且这个展示不仅是产品层面展示，比如免费，可能一般你不会把它当做一个产品策略，而是一个商业化或经营策略。

OpenAI不放出o1思考过程，可能没有那么用户导向——它在想别人拿到这个就可以去训模型了——会有一点竞争（思维）。

所以我会说DeepSeek很单纯。

我做出来了，拿个东西给大家感受到——巨好。没有那么多事情。

张小珺：你怎么看待DeepSeek更长远的战略卡位？

肖弘： 我不知道。可能DeepSeek还在考虑——主要精力在开源模型，还是把DeepSeek当做OpenAI一样的重要消费者产品，把它商业化？我不确定他们会怎么思考这件事，但今天它确实在一个非常好的位置。

我不确定DeepSeek是否会把做一个超级App当做这家组织的目标？很多时候是选择出来的。

OpenAI如果不是Sam Altman而是Ilya是CEO，可能不会把ChatGPT变成今天这个样子。

这个还是很动态。

但不管怎样。今天DeepSeek的模型进步，DeepSeek这个App在全世界的反响——尽管我觉得无法复制，也是振奋人心的。

“所以我想：OK，还不够，

应该有个虚拟机”

张小珺：刚才我们在聊原厂会做什么。原厂看起来都会做Chatbot。

肖弘： 当然Chatbot本身还在快速进化，包括你看人类对未来想象里面，所谓的AI Assistant（AI助理），就是你跟他说一句话，他帮你把事干了，帮你把东西查了。

这是符合人类想象的，原厂肯定会做这个东西。

张小珺：应用公司呢？

肖弘： 当然有争议。有些投资人或founder持有这个观点：OK，Chatbot是原厂一定会做的，那我们就不做，躲开它。

我自己没有那么悲观。

今天的技术还在快速发展中，是不是直接你就把它当成不能做？有点早。

坦白讲，我们最近Agent产品，看上去应该就是一个Chatbot，这是很符合大家想象的。

但它在应用这一侧做的事情又很复杂，而且这种复杂还不是像Monica，做了很多，比如说“功能”。它要用好这些模型就挺复杂的——我觉得值得试一试。

有点像我刚刚说的在开放平台里第三类产品：哪怕有窗口期你也值得试一试。

张小珺：Agent的定义是“大语言模型调动外部世界”，它跟之前我们看到的那些产品有本质区分吗？

肖弘： Agent这个概念2023年就有了，但一直没有真正被大家感受到的产品形态。

也许朱啸虎会说我不相信Agent，就像他说我不相信AGI一样。也许明年这个时候他会说我相信Agent了（笑）——希望如此。

Agent就是能感知环境，自主执行任务。你给它一句话很抽象，它能把这个任务搞定。

过去几年，Agent领域低于预期最核心的原因是：模型不够聪明，没办法自动搞定很多事。

第二，之前，包括我们在做Monica的过程，我们说：好，它能执行任务，那行，我们给它接一些API，我们一个个给它接。

光有语言模型不够，它要联网搜索，我就给它接一个搜索API；它要能读知识库，好，我们去做一个知识库，让用户可以上传文件，查一遍知识库，给你答案；它要做PPT、画图…

我们在开发Monica的过程，就是给它做了一大堆API，把各种各样API都往上接。但你有没有发现——这个事情很像做功能机 ——功能机就是，诶，用户需要这个？好！当时的手机厂商就专门做一个feature phone。

Feature phone的感觉就是，一个一个feature加起来的phone。

张小珺：堆叠起来。

肖弘： 所以我在做Monica过程中，坦白讲，尽管Monica已经集成了很多东西，也确实花了很长时间，但感觉像在做feature phone，功能机——你在给它一个个接API。

但真正的Agent，应该是自己能写代码，调用API并执行。它能搞定很多长尾任务，而且不需要开发者自己写，这才是符合大家对Agent的想象。

我记得有位前辈，白鸦（有赞创始人），我跟他说Monica做到极致，把很多东西都集成进去。

他说：Red，极致是不够的，个性化才够——做到极致你就是hao123，做到个性化你才是Google。这是非常具有启发意义的一句话，我们花了很多时间研究。

当我看到Cursor，各种各样的写代码的公司出现，越来越大众化，而不是越来越给工程师用。今天你访谈很多工程师，他能挑出很多毛病，越资深的工程师会挑出越大的毛病，但小白越来用越爽。

而且我记得当时Cursor出来之后，又有竞争对手叫Windsurf，Windsurf有一个跟Cursor不一样的地方。但Cursor后来也跟进了YOLO模式，这个名字很神奇，Y-O-L-O。很像年轻一代的人会说词。

但意思是You Only Look Once——你只要看一次过程我都能搞定了。

它跟原来的区别在哪？你原来写一段代码，你拿Python跑，但你的电脑上可能没有装某个库，啪就报错了；有了YOLO模式，报错，它自动放到LLM里，帮你解决掉它。

有一天我在用Windsurf的类似 YOLO模式，我发现，我给它说一个问题，它说，好，我现在去Github上下这个代码去搞一个什么事情，然后再去写—— 那一瞬间我就被闪电击中一样的感觉！ ——它居然在用工具，而且会用人类工具。（比如Github上，理论上什么代码都有对吧？创建所有工具他都可以去用。）

那个时候我觉得Agent时代真的是到了。

张小珺：Agent这件事是原厂会做还是应用公司会做？

肖弘： 原厂值得做，但好像原厂做得不够好。（笑）

所以我自己觉得，所谓Agent应该是，能解决长尾需求，能调用各种各样工具。最好被调用的工具，当然就是存量代码和它自己编写代码，通过API去搞定事情。

当然有这些还不够。因为人类还有很多知识，或者很多服务，不是通过API调用，是通过Web调用。在海外，我觉得还得带一个浏览器。

还有一个本质区别：我当时用Windsurf，它跑在我电脑上，但它有时要让我确认一下要不要装这个库；或者它执行一个命令行操作，让我填yes or no，因为它可能真会把我电脑搞坏，或者是某个东西冲突——但其实它让我填yes，也挺甩锅的。

如果我是一个特别小白的人，我怎么知道yes or no？但它让我填yes，好像这个责任就在我身上了，搞坏了不关它的事。

很多年前，有个人问比尔盖茨：为什么Windows跟我谈，说这个东西打开可能会危害电脑，yes or no？靠！你微软都不知道，我一个普通用户怎么会知道？

所以看到那个时候我觉得，好像也没有You Only Look Once，你还要Yes一下。况且如果真是小白，是普通用户，真是看不懂。

所以我想：OK，还不够，应该有个虚拟机——Chatbot应该在云上有个电脑，把它写的代码，把它要通过浏览器查的东西都在那台电脑上执行。

因为是虚拟服务器，坏了无所谓，它可以再来一台。它甚至可以在当前任务执行完之后释放掉那个服务器。

所以我自己觉得，那个架构叫做一个虚拟服务器、一个浏览器，能够自己写代码去调用API，它就能胜任各种各样长尾任务——这是我们在做的事情。

张小珺：现在模型能力ready吗？

肖弘： 今天刚刚好。我们maybe去年底才意识到它差不多。

刚刚所有事都是被串联起来——比如去观察Cursor，去看到它使用Github代码，而且回到最开始我说的发展历程，从Jasper到ChatGPT到Monica到Cursor，下一个是什么？

你会发现它消耗了越来越多token，甚至有点进阶对吧？比如你写代码已经超过普通人的能力了，但AI是可以的。

并且还有一点，它要自己多轮迭代运行。你给它设置一个任务，它会遇到挫折，可能会报错，它还会尝试，一直尝试去解决。

今天是模型足够好，所以我们搭出一个最基础版本跑通了。当然还不够聪明。我们看到ChatGPT发布了Operator之类，很多任务完成率也不够高，模型仍旧需要更聪明。

所以我还是期待厂商的模型更聪明吧！成本更低吧！

应用厂商无情的消耗巨量的token，吞噬掉大量的token。

“它应该是异步的”

张小珺：你这个产品跟Cursor像吗？

肖弘： 应该让它不像。

张小珺：是一个编程类产品？

肖弘： 不不，不是编程，消费级产品应该让大家感觉像Chatbot。

消费级很重要。

张小珺：还会沿着Monica演变吗？

肖弘： 会单独发布新产品。因为你无法想象hao123和百度是同一个产品。（笑）

张小珺：还是一个类Chatbot产品，但你在产品上做了很多迭代？

肖弘： 是。

张小珺：它跟DeepSeek像吗？

肖弘：Reasoning把思考过程放出来，是必须的。当然可能我们管它叫Planner。

比如你提一个问题，它会把它拆成很多步骤，每一步搞定什么事，最后搞定这个事情。

这里带来了两件很重要的事：一是关于模型，一是关于体验。

关于体验我先说，它应该是异步的。

今天所有Chatbot的体验都是你发一句话，它回你一句话。比如它回复的过程，你再跟它说的话，可能中断上面那句话了。

所以今天的Chatbot，都是同步的。还有一些朋友会用一个描述叫“瀑布式的”，就是A-B-A-B。但人类聊天不这样。

你发一条消息给我，可能我过很久才回，在过很久回的过程中，你又给我发两三条消息，我一起回你几个topic。或者某位同事说要做一件事，做到一半我发现搞错了，我跟他说搞错了我重来。

人类沟通过程，不像现在我们看到Chatbot一样，是A-B-A-B。它有大量分叉，甚至某个任务要执行一段时间。

所以，今天所有Chatbot如果都发A，必须在一步之内搞定，有很多局限性。很多时候，比如你让它干一个事，它是最终要搞定这个事，但要先去干一个事，获取那个结果，把那个结果当作输入的一部分再去做第二件事，需要时间。

我们无法想象你交给任何一个哪怕再聪明的实习生，你问他所有事情，他都秒答——这是不现实的。他要花点时间查询、思考。

张小珺：你的产品大概是，我给它一个需求，它过一段时间回复我？

肖弘：

对话Manus肖弘：世界不是线性外推，做博弈中的重要变量

正文

请到「今天看啥」查看全文