专栏名称: 字母榜
让未来不止于大
目录
相关文章推荐
闽南日报  ·  暴跌!即将抵达漳州! ·  16 小时前  
闹闹每日星运  ·  最适合做自由职业的4个星座 ·  3 天前  
闹闹每日星运  ·  最伤白羊座心的三大行为 ·  4 天前  
每日豆瓣  ·  怎么会有人在兜里揣屎啊 ·  4 天前  
51好读  ›  专栏  ›  字母榜

对话Manus肖弘:世界不是线性外推,做博弈中的重要变量

字母榜  · 公众号  ·  · 2025-03-10 18:16

正文

文 | 张小珺
编辑 | 马龙
转载自 | 腾讯科技(ID:qqtech)


和DeepSeek等从大模型开始构建底层能力的AI公司不同,Manus AI是一家从day 1就只做AI应用的创业公司。

创始人兼CEO肖弘(英文名:Red)出生于1992年,2015年从华中科技大学毕业后,第一段创业是移动互联网to B方向;2022年6月开始第二段AI方向创业,至今快3年。

在创投业内, 很多人认知他是一名“有产品手感的founder” ,而非像梁文锋、杨植麟这样的技术背景创始人。 截至目前,Manus母公司蝴蝶效应共完成两轮融资,总规模超过1千万美金,第一轮投资人是真格基金(真格是肖弘上一段创业的天使投资人,他们把从肖弘上个项目赚得的所有资金全部投到他的这个项目中);第二轮投资人包括红杉中国、腾讯、真格和王慧文。

2023年,在投资人的撮合之下,该公司引入季逸超(原Peak Labs创始人兼CEO,现Manus AI首席科学家)、张涛(原光年之外产品负责人,现Manus AI产品负责人)等核心成员加入。

从去年开始,我对肖弘在不同时期进行了多次谈话, 展开了一场“接力式访谈”。 大模型的模型能力在迅速变化,身处其中的创业者要不断根据外部环境身段柔软地调整姿势。我希望记录一名AI应用创业者,在技术变革之中、当一切都处于不稳定状态下的持续思考历程——而这个历程富有魅力之处就在于,它是变化的,而且还会继续变化。

我们正在开启的2025可能会是AI应用爆发的元年、Agent爆发的元年, Manus打响了国内Agent第一枪。 本次访谈是来自一线“AI应用爆发”、“Agent爆发”的前沿声音。

播客放出来的访谈包含两次:

第一次在2024年10月,围绕肖弘第一段创业和第二段创业的第一款产品Monica.im展开;

第二次在2025年2月,此时DeepSeek一时改写了中国AI应用底层生态。这次围绕他们的第二款产品、也是新产品(当时还没发布)Manus.im展开。

文字版本重点整理第二次访谈内容: 这款Agent产品Manus诞生背后,创始人的完整思维链展示。

过去两年,肖弘对大模型、产品和创业有一些思考和总结,譬如:
1) “新时代的安迪比尔定律”:模型能力正在外溢,AI应用公司可以吃掉它;
2) 开源一个创业idea:你预判下一个能力是什么,先把这部分应用做好,在前方等着模型能力变强;
3) OpenAI很遗憾,DeepSeek思考展示是整个人类第一次看到,因为OpenAI o1是收费的;
4)  什么产品应该大模型原厂做?什么应该应用公司做?1、垂直领域、特定领域,可能原厂不做;2、脏活累活,可能原厂不做;3、有一些原厂可能以后会做,有窗口期;
5) founder的思维模型,应该“用博弈的方式思考”,而不是“用逻辑推理的方式思考”;
6) 当你意识到你在创新、在领先,应当更激进,超级激进;
7) 今天的中国创业者就应该更激进地全球化。
访谈中,你也能看出, 在技术变革之中、在巨头环绕的AI丛林之中、当地基处于极其不稳固的状态下,一位AI应用创始人的真实的心理状态。
“应该用最疯狂的幻想去理解,”肖弘说,“最好不用做空它。”
肖弘称,他的合伙人季逸超在今年英伟达客户答谢会上,见到了黄仁勋。季问了老黄一个问题:接下来几年,什么事情发生会让你觉得很惊讶?
黄仁勋的回答是:Basically nothing。

(如果大家对他做Manus之前的创业故事也很感兴趣,欢迎收听播客《张小珺Jùn|商业访谈录》,有很多坦白的表达。)



“新时代的安迪比尔定律”


张小珺:刚刚过去的春节是你们最繁忙的一个春节了?
肖弘: 挺忙的。当然大家已经放假了,但也做了很多沟通,很多同事在工作。
张小珺:春节在憋什么大招?
肖弘: 之前跟你提过的Agent产品在赶着迭代。没想到这个春节 DeepSeek又来一波很火的现象级传播——从各种意义影响都很广泛。讨论,做了很多工作。
张小珺:你们即将要发的Agent产品能不能展开讲讲?
肖弘: 我想分享一个我最近的观察。
我们看到,最开始,ChatGPT之前最火的AI应用是Jasper,然后是ChatGPT,然后是Monica(做浏览器插件)以及豆包之类。接下来Cursor又火了——你会发现AI应用在快速变化,每年都会出现新的AI应用。
我自己就在尝试总结规律,做预测。尽管很多时候依赖少数数据点,描述规律不一定准确,但人类总是习惯去做这样的预测。
我自己感觉,如果我们把这几个应用作为数据点看,是有一些规律的。
比如说Jasper可能大家没用过,他的产品形态是,你要写一个marketing的文章,你要填空——听众是谁,主题是什么——填完之后帮你输出。
ChatGPT是对话式,从填空到对话,更符合直觉。
从ChatGPT到Monica这种自带上下文、自带context的,豆包和夸克都在此范畴—— 不仅是一个Chatbot(聊天机器人),而且是给Chatbot补充了上下文。 用户所看到的屏幕里的文章,或者在某个应用里、邮箱里,在用户授权的情况下可以帮他回邮件。就相当于,不单纯是一个Chatbot,而是带上了context的Chatbot。
再往后到Cursor。它火了之后,两个人群在用:一类是工程师,另一类接近产品经理,甚至都不一定是产品经理。举个例子,他在运营公众号,通过Cursor分析公众号数据——这显然不是工程师需求。
他可能也把他当Chatbot用——左边是代码内容,右边是像co-pilot(副驾驶员)区域,他是不会看左边的。写出来代码,有问题也只跟 Chatbot说;他不会说这里有问题,手动改代码。
某种程度上,它也是当Chatbot用,而这个Chatbot跟前面几个Chatbot区别在于:它不仅能对话聊天,带上context,而且当你提出需求,它通过写代码的方式帮你解决这个问题。
我自己看到Cursor的时候 ——当然很多团队应该在往编程这个方向理解,我觉得这当然需要,工程师也是很大群体—— 但我自己把它当普通用户需求在理解。
我看到的这个规律是什么呢?
首先是,越来越符合普通人习惯。从表单到普通对话是更符合普通人习惯的,带上context可以使大家更方便。
比如,你不用像使用ChatGPT一样复制粘贴文章进去,它本身就带着你的context。更早之前也有人用ChatGPT写出代码,把代码再复制粘贴到一个比如Python脚本再去运行,如果有bug还要再把报错报给ChatGPT,ChatGPT写出来代码,再手动合并到代码文件去。这些很繁琐,但Cursor把这个事做得很好。
一个主线,它当然越来越符合人的习惯,而且能力越来越强大,而这种能力的强大是随着LLM能力外溢出来。
Cursor是一家挺早的公司,这个公司成立在2022年甚至更早,它最开始也不是做代码编辑器;而且即便做了代码编辑器,一开始也没火。
它真正为大家所知是2024年7-8月份,因为Claude 3.5 Sonnet发布了。
张小珺:它还是因为一个模型能力的直接提升带来它产品能力的迭代。
肖弘: 对,前面说了那么多,核心我想表达的是什么呢?
模型能力在快速进化,但是“那个壳”也需要进化。
每一代模型能力进化之后,甚至不一定是原厂,是一个第三方厂商把它的用户可感知价值给呈现出来。
如果没有Cursor,我相信Claude 3.5 Sonnet,可能在Claude里面也能写代码,但就不会那么流畅。
我自己总结出来的定律叫做:“新时代的安迪比尔定律”。
(Andy and Bill’s Law,原话是“Andy gives, Bill takes away”/“安迪提供什么,比尔拿走什么”。)
在PC和半导体产业有这个定律——不管Andy Grove造了什么,他是Intel代表,Bill Gates就会吃掉它——Intel因为摩尔定律在,可能18月之后成本下降了、算力上升了,但18月之后Windows也会把它的能力吃掉。可能Windows更图形化,或者提供了更强大能力。
LLM一直在进化。大家看到的模型越来越便宜、越来越强大,强大甚至体现在,原来我们觉得可能简单的写作、回答问题、信息检索。但接下来它会使用工具,它可以写代码,可以调用API。我们最近看到ChatGPT发布了Operator,可以调用浏览器—— 这些都是模型能力正在外溢。
那个“壳”是什么?
原厂肯定在定义,但也需要跟创业者一起定义。Claude是非常好的例子。
大家都知道Monica没有自己做大模型基座。春节假期,我在看一些半导体相关的书——张仲谋的自传。
AMD创办人Jerry Sanders当时有一句话:真男人一定要有晶圆厂!
就是diss那些只有设计能力,但没有芯片制造能力的公司——他说这种公司也太不行了,无法跟我们竞争。
但你看,用张仲谋的话说,台积电创造了两个行业:一个行业是专业的芯片生产制造公司,就是台积电;另一个行业是专业的设计公司。
如果没有台积电出现,那也不存在“设计公司”和“生产公司”分工。
张小珺:你是设计公司。
肖弘: 对。当然我们看产业规律,一般来说,最开始是垂直整合,后面慢慢会有分层。
最开始我们就持有这个观点: 模型应该会普通商品化。
大家现在看到这一点,但这一点,你没有这项能力的人下定论有点危险。因为模型在快速进化。理论上它呈现出来的状态好像不是在普通商品化,因为总有人更厉害一些——但站在更长期的视角,我感觉是的。
我们这家公司的选择是,模型在快速发展,有很多家。更长期视角看,应该不一定叫停滞,而是有若干家进入还不错的水平。 在这个时候,单纯做应用可能更简单一点,我们不用投入大量资金训模型。
当然对于有模型的公司,我们是非常尊敬的。 这一波主要进步是他们的创新和努力带来的。 但这不是冲突的或者零和的,叫做“做应用”还是“做模型”的问题。
而是,即便是有模型公司在发展,也需要一些主要围绕用户视角、产品视角的公司去做一些工作。不是非此即彼的。

我们跟模型厂的关系都很好。



“开源一个创业idea:
你预判下一个能力是什么,
先把这部分应用做好”

张小珺:你觉得今天的产品定义能力到了一个什么水平?和模型能力比谁更强?

肖弘: 按照刚刚的叙事,所有突破都是模型带来的,就是模型跑得更前面。基本上是模型先驱动、模型先行。

之后你会发现,原厂像ChatGPT,我感觉它在发布时不觉得自己会那么火;包括 DeepSeek在发布时,我相信,这一切不是它预料的—— 原厂基本准备不足。

第二,专业的或者应用厂商,总是在模型先发出来之后,PMF可能才完成。比如Cursor。它这个产品更早有,当时用的可能是OpenAI模型。

张小珺:相当于是先在那里等着模型能力变强。

肖弘: 啊,对!

可以开源一个创业idea:你预判下一个能力是什么,先把这部分应用给好好做好。等着这个能力有了,你就…

你等到那个时候再去做,其实就晚了,对吧?

因为总有一些人,不管是他信仰这个,还是他对foundation model(基座模型)更了解,或者Cursor我就做编程领域。总有些人会去做这个产品。

这也很有意思。你看VC投资难度也变大了——因为当你看到那个产品,因为模型能力不ready,它好像不太work,一用感觉很傻;但等到模型ready,它突然就很厉害了。到那个时候它的商业化做得也比较好。

它的曲线是一个跳变。

张小珺:但是你看,现在模型能力先行,当模型发的时候原厂可能准备不足。作为一个应用公司,你可以在前面等着它,由于它模型能力变强,带来你的爆发式增长。

这个时候原厂,模型掌握自己手里,它可以快速跟进。比如,用跟进策略做一个Cursor类似的产品。

这时候,这两家公司的竞争会如何展开?

肖弘: 今天我们看到所有国内、国外模型公司,都有自己的应用和开放平台的——基本都做了Chatbot和一个开放平台,第三方可以通过API调用它。

这里有个事情是:我们对AGI的理解是什么?它应该还是有公共产品属性的,原厂应该不会什么事都做。

第一,有巨多的事,它不会每个事都做。比如说特定行业的事,一般不会做。

第二,特别辛苦的事,它可能也不会做,或者说需要很多工程师的。

我去Google,看到4:00pm人在遛狗,我觉得他们应该不至于搞100个工程师跟大家卷很具体的应用。

因为对它来说,把壁垒最好的那部分抓在手里就好了,其他事情交给别人去做,对它来说更好。

张小珺:反正可以通过API收钱。

肖弘: 对。

张小珺:所以,(作为AI应用创始人,)不能做最肥的那块业务。

肖弘: 对,但 有些当然可能有窗口期——比如长期看它会做,短期还没顾得上——这种事情在今天很考验创业者。 有些人选择做,有些人选择不做。

有窗口期的事情要不要做?大家得到的答案不同。

比如在上一场战争,应用商店,后来我们知道会被原厂做对吧?但在那个moment,有第三方应用商店出现,在窗口期从创业角度得到很好结果,也有被并购掉对吧?

但这一次有窗口期的事情怎么做?窗口期内要取得什么样的成绩?去为下一步做什么样的准备?这些是更复杂的问题了。

总结一下——基于API的生意,1、我觉得垂直领域、特定领域的,可能原厂不会做;2、脏活累活,可能原厂不会做;3、有一些原厂可能以后会做,有窗口期。

所谓窗口期复杂就复杂在——也许你做得很好,它就不做了——这不是逻辑推导出来的。

你假定它一定会做,或者它一定不会做,都不一定。有可能真的在生态里面,有一个领头羊做得很好,可能原厂也就不会做了。

今天是非常灵活的,没有确定答案。

对立面是什么?那就是原厂会做的事——Chatbot,看上去大家都是会做的。



“OpenAI很遗憾,

DeepSeek的思考展示

是整个人类第一次看到”


张小珺:为什么大家都要做Chatbot?Chatbot在争什么?

肖弘: 我倒不用争什么的视角看,大家也不是用争什么这个视角。而是它挺符合对AGI的想象——一个对话界面,啥都能干。

大家好像觉得我光做个模型不够,至少得有个Chatbot。

By the way,在所有人中,我感觉DeepSeek对要不要做Chatbot,反而是最佛的。 但到今天为止,他却取得最好结果。

张小珺:为什么呢?

肖弘: 首先我说佛,它是在12月份才有自己的App,更早有网页版。你看它的App,会觉得真的“套壳”——只是把模型能力用一个最简单的基础的“壳”展示出来。

张小珺:套自己的“壳”。

肖弘: 另一个角度:如果(DeepSeek)没有做这件事,这次影响和传播不会那么大。因为很多用户是用上了、看到了它的App,看到思考过程,有巨大用户体验提升,又导致大量传播——但这一切是意料之外。

本身这件事肯定非常复杂,有各种各样的原因,中美地缘政治背景,有开源、闭源背景。

我想说的是:我最大感受,这件事情精神上给大家很大鼓励!——从旁观者角度,可能他们也没想给大家鼓励。

今天大家可能也会想,开源火了,要不要开源?要不要构建技术品牌?各种各样的思考。但最重要的是, DeepSeek 一直按自己的节奏在做——Be Yourself!

他一直在开源,前面没火他也在开源,只是在按照自己的节奏做事情。

我记得我们在微信聊天,你问我,如果我是其他几家foundation model公司,我会怎么办?我后来想一下——就是“做自己”最重要,而不是“应激”。

当然foundation model公司创始人们,取得成绩比我们大很多啊。我只是假定,如果我在经营公司,在这种时候最重要的还是按自己节奏来。你会发现简单做好技术,也会得到巨大奖励。尽管这不可复制。

张小珺:能不能讲讲你对DeepSeek这个产品的感受?

肖弘: Perplexity的CEO发了一条推特说,在AI时代有两个巨大体验创新:一是,Perplexity把这句话从引用哪个网页标注出来,增加结果可信度。

二是,把LLM思考过程展示出来。

抛开开源或技术各种指标——我聊了一些老家的朋友,他们能感受到DeepSeek巨大不一样是:DeepSeek把怎么想这个问题的过程展示出来了,这是体验创新。

当然OpenAI o1,也有思考,但 OpenAI很遗憾——DeepSeek的思考过程展示可能是整个人类第一次看到这个事情,因为 OpenAI o1是要收费的!

最近它才把思考过程全部展示出来。它是怕别人可能看到思考过程,有这个数据去做自己的训练。所以它就展示简化版的。说实话,看上去没有太大意思。

首先,因为OpenAI收费,有门槛,很多人根本不知道这回事。

其次,它也没有把思考过程完整展示出来,所以o1错过了体验创新。

DeepSeek思考过程放出来,本身就是巨大体验提升。还联网。o1此前不联网。

还有一点,确实它的模型质量很好。 大家原来体验过的基线是普通水平,但DeepSeek新模型,拉到了第一梯队体验。写出的文章就是好很多,聊天更有情商,本身模型能力进化很好,体验上有创新。创新可以很容易被大家感知到,而不是被各种各样的门槛堆起来。

张小珺:OpenAI定义了产品的迭代——第一个是Chatbot(聊天机器人),通过 ChatGPT这个产品,我们知道了Chatbot的用户形态;第二个是Reasoner(推理者),它做了o1,可是没让用户真正感受到技术和产品的链接,反而是从DeepSeek感受到 Reasoner的威力。

还有一点,前段时间我们做了一个播客。去对比阅读DeepSeek-R1和Kimi K1.5的论文,发现Kimi在它的产品体验上刻意让回答变短,而DeepSeek的输出是长的。

以前大家以为从用户定义上输出短更好,但DeepSeek却反直觉,是长更好,大家喜欢看它思考。

肖弘: 对。我们自己最近做Agent产品也有这个感受。

我们要教他:你少用点bullet point(要点总结),不要一点点,太总结了,你就逐字写出来就好了。这个也很神奇。

最开始大家觉得精炼一点会好。当大家发现Chatbot都是精练的输出,就会说,你多讲一讲、我多看一看。

张小珺:总结一下,DeepSeek它不仅是技术强,产品定义也是不错的对吧?

肖弘: 我觉得应该这么说——它把技术上的创新点,以一个用户可感知的方式展示了出来,而且这个展示不仅是产品层面展示,比如免费,可能一般你不会把它当做一个产品策略,而是一个商业化或经营策略。

OpenAI不放出o1思考过程,可能没有那么用户导向——它在想别人拿到这个就可以去训模型了——会有一点竞争(思维)。

所以我会说DeepSeek很单纯。

我做出来了,拿个东西给大家感受到——巨好。没有那么多事情。

张小珺:你怎么看待DeepSeek更长远的战略卡位?

肖弘: 我不知道。可能DeepSeek还在考虑——主要精力在开源模型,还是把DeepSeek当做OpenAI一样的重要消费者产品,把它商业化?我不确定他们会怎么思考这件事,但今天它确实在一个非常好的位置。

我不确定DeepSeek是否会把做一个超级App当做这家组织的目标?很多时候是选择出来的。

OpenAI如果不是Sam Altman而是Ilya是CEO,可能不会把ChatGPT变成今天这个样子。

这个还是很动态。

但不管怎样。今天DeepSeek的模型进步,DeepSeek这个App在全世界的反响——尽管我觉得无法复制,也是振奋人心的。


“所以我想:OK,还不够,
应该有个虚拟机”

张小珺:刚才我们在聊原厂会做什么。原厂看起来都会做Chatbot。
肖弘: 当然Chatbot本身还在快速进化,包括你看人类对未来想象里面,所谓的AI Assistant(AI助理),就是你跟他说一句话,他帮你把事干了,帮你把东西查了。
这是符合人类想象的,原厂肯定会做这个东西。
张小珺:应用公司呢?
肖弘: 当然有争议。有些投资人或founder持有这个观点:OK,Chatbot是原厂一定会做的,那我们就不做,躲开它。
我自己没有那么悲观。
今天的技术还在快速发展中,是不是直接你就把它当成不能做?有点早。
坦白讲,我们最近Agent产品,看上去应该就是一个Chatbot,这是很符合大家想象的。
但它在应用这一侧做的事情又很复杂,而且这种复杂还不是像Monica,做了很多,比如说“功能”。它要用好这些模型就挺复杂的——我觉得值得试一试。
有点像我刚刚说的在开放平台里第三类产品: 哪怕有窗口期你也值得试一试。
张小珺:Agent的定义是“大语言模型调动外部世界”,它跟之前我们看到的那些产品有本质区分吗?
肖弘: Agent这个概念2023年就有了,但一直没有真正被大家感受到的产品形态。
也许朱啸虎会说我不相信Agent,就像他说我不相信AGI一样。也许明年这个时候他会说我相信Agent了(笑)——希望如此。
Agent就是能感知环境,自主执行任务。你给它一句话很抽象,它能把这个任务搞定。
过去几年,Agent领域低于预期最核心的原因是:模型不够聪明,没办法自动搞定很多事。
第二,之前,包括我们在做Monica的过程,我们说:好,它能执行任务,那行,我们给它接一些API,我们一个个给它接。
光有语言模型不够,它要联网搜索,我就给它接一个搜索API;它要能读知识库,好,我们去做一个知识库,让用户可以上传文件,查一遍知识库,给你答案;它要做PPT、画图…
我们在开发Monica的过程,就是给它做了一大堆API,把各种各样API都往上接。但你有没有发现——这个事情很像做功能机 ——功能机就是,诶,用户需要这个?好!当时的手机厂商就专门做一个feature phone。
Feature phone的感觉就是,一个一个feature加起来的phone。
张小珺:堆叠起来。
肖弘: 所以我在做Monica过程中,坦白讲,尽管Monica已经集成了很多东西,也确实花了很长时间,但感觉像在做feature phone,功能机——你在给它一个个接API。
但真正的Agent,应该是自己能写代码,调用API并执行。它能搞定很多长尾任务,而且不需要开发者自己写,这才是符合大家对Agent的想象。
我记得有位前辈,白鸦(有赞创始人),我跟他说Monica做到极致,把很多东西都集成进去。
他说:Red,极致是不够的,个性化才够——做到极致你就是hao123,做到个性化你才是Google。 这是非常具有启发意义的一句话,我们花了很多时间研究。
当我看到Cursor,各种各样的写代码的公司出现,越来越大众化,而不是越来越给工程师用。今天你访谈很多工程师,他能挑出很多毛病,越资深的工程师会挑出越大的毛病,但小白越来用越爽。
而且我记得当时Cursor出来之后,又有竞争对手叫Windsurf,Windsurf有一个跟Cursor不一样的地方。但Cursor后来也跟进了YOLO模式,这个名字很神奇,Y-O-L-O。很像年轻一代的人会说词。
但意思是You Only Look Once——你只要看一次过程我都能搞定了。
它跟原来的区别在哪?你原来写一段代码,你拿Python跑,但你的电脑上可能没有装某个库,啪就报错了;有了YOLO模式,报错,它自动放到LLM里,帮你解决掉它。
有一天我在用Windsurf的类似 YOLO模式,我发现,我给它说一个问题,它说,好,我现在去Github上下这个代码去搞一个什么事情,然后再去写—— 那一瞬间我就被闪电击中一样的感觉! ——它居然在用工具,而且会用人类工具。(比如Github上,理论上什么代码都有对吧?创建所有工具他都可以去用。)
那个时候我觉得Agent时代真的是到了。
张小珺:Agent这件事是原厂会做还是应用公司会做?
肖弘: 原厂值得做,但好像原厂做得不够好。(笑)
所以我自己觉得, 所谓Agent应该是,能解决长尾需求,能调用各种各样工具。最好被调用的工具,当然就是存量代码和它自己编写代码,通过API去搞定事情。
当然有这些还不够。因为人类还有很多知识,或者很多服务,不是通过API调用,是通过Web调用。在海外,我觉得还得带一个浏览器。
还有一个本质区别:我当时用Windsurf,它跑在我电脑上,但它有时要让我确认一下要不要装这个库;或者它执行一个命令行操作,让我填yes or no,因为它可能真会把我电脑搞坏,或者是某个东西冲突——但其实它让我填yes,也挺甩锅的。
如果我是一个特别小白的人,我怎么知道yes or no?但它让我填yes,好像这个责任就在我身上了,搞坏了不关它的事。
很多年前,有个人问比尔盖茨:为什么Windows跟我谈,说这个东西打开可能会危害电脑,yes or no?靠!你微软都不知道,我一个普通用户怎么会知道?
所以看到那个时候我觉得,好像也没有You Only Look Once,你还要Yes一下。况且如果真是小白,是普通用户,真是看不懂。
所以我想:OK,还不够,应该有个虚拟机——Chatbot应该在云上有个电脑,把它写的代码 把它要通过浏览器查的东西都在那台电脑上执行。
因为是虚拟服务器,坏了无所谓,它可以再来一台。它甚至可以在当前任务执行完之后释放掉那个服务器。
所以我自己觉得,那个架构叫做一个虚拟服务器、一个浏览器,能够自己写代码去调用API,它就能胜任各种各样长尾任务——这是我们在做的事情。
张小珺:现在模型能力ready吗?
肖弘: 今天刚刚好。我们maybe去年底才意识到它差不多。
刚刚所有事都是被串联起来——比如去观察Cursor,去看到它使用Github代码,而且回到最开始我说的发展历程,从Jasper到ChatGPT到Monica到Cursor,下一个是什么?
你会发现它消耗了越来越多token,甚至有点进阶对吧?比如你写代码已经超过普通人的能力了,但AI是可以的。
并且还有一点,它要自己多轮迭代运行。你给它设置一个任务,它会遇到挫折,可能会报错,它还会尝试,一直尝试去解决。
今天是模型足够好,所以我们搭出一个最基础版本跑通了。当然还不够聪明。我们看到ChatGPT发布了Operator之类,很多任务完成率也不够高,模型仍旧需要更聪明。
所以我还是期待厂商的模型更聪明吧!成本更低吧!

应用厂商无情的消耗巨量的token,吞噬掉大量的token。



“它应该是异步的”

张小珺:你这个产品跟Cursor像吗?
肖弘: 应该让它不像。
张小珺:是一个编程类产品?
肖弘: 不不,不是编程,消费级产品应该让大家感觉像Chatbot。
消费级很重要。
张小珺:还会沿着Monica演变吗?
肖弘: 会单独发布新产品。因为你无法想象hao123和百度是同一个产品。(笑)
张小珺:还是一个类Chatbot产品,但你在产品上做了很多迭代?
肖弘: 是。
张小珺:它跟DeepSeek像吗?
肖弘 :Reasoning把思考过程放出来,是必须的。当然可能我们管它叫Planner。
比如你提一个问题,它会把它拆成很多步骤,每一步搞定什么事,最后搞定这个事情。
这里带来了两件很重要的事:一是关于模型,一是关于体验。
关于体验我先说,它应该是异步的。
今天所有Chatbot的体验都是你发一句话,它回你一句话。比如它回复的过程,你再跟它说的话,可能中断上面那句话了。
所以今天的Chatbot,都是同步的。还有一些朋友会用一个描述叫“瀑布式的”,就是A-B-A-B。但人类聊天不这样。
你发一条消息给我,可能我过很久才回,在过很久回的过程中,你又给我发两三条消息,我一起回你几个topic。或者某位同事说要做一件事,做到一半我发现搞错了,我跟他说搞错了我重来。
人类沟通过程,不像现在我们看到Chatbot一样,是A-B-A-B。它有大量分叉,甚至某个任务要执行一段时间。
所以,今天所有Chatbot如果都发A,必须在一步之内搞定,有很多局限性。很多时候,比如你让它干一个事,它是最终要搞定这个事,但要先去干一个事,获取那个结果,把那个结果当作输入的一部分再去做第二件事,需要时间。
我们无法想象你交给任何一个哪怕再聪明的实习生,你问他所有事情,他都秒答——这是不现实的。他要花点时间查询、思考。
张小珺:你的产品大概是,我给它一个需求,它过一段时间回复我?
肖弘:






请到「今天看啥」查看全文