作者 |
王兆洋
如果根据AI自媒体们的标题来看,昨天全世界AI圈应该无人存活,因为他们又被“炸”了。
这次扔炸弹的是一个叫做“Manus”的产品。它是一个中国团队开发的只通过一部全英文的宣传片发布的,没有邀请码就用不了的 AI Agent 产品,官方称它为“全球首个通用 Agent”。
仿佛OpenAI 的 Operator 和 Anthropic 的 Claude Coder们,一夜之间都被炸得不存在了。
而发布后,它在一个小圈子里迅速传播起来,“炸裂”不断,迅速走向了另一个熟悉的味道:
中国又一个 DeepSeek 来了。
中国肯定需要不止一个 DeepSeek,但它应该是一个怎样的存在,是一个问题。
仿佛 Open AI和 Anthropic 不存在
先不去看这些标题,我们来看看Manus是个什么产品。
根据它的视频和官网上的信息,它是一个可以“可以解决各类复杂多变的任务,能通过独立思考和系统规划,在自己的虚拟环境中灵活调用各类工具为你直接交付完整的任务成果,而非仅仅提供建议或答案的Agent”。
今天所有让人辨别不清的AI Agent们,基本都会这么介绍自己。
它目前没有公开上线,只能通过邀请码使用,而它的发布主要通过一个演示视频。
在演示视频中,它展示了三个场景:上传包含多个简历的压缩包,根据你的提示词,Manus自动帮你解压缩并分析简历,然后给出建议;提出你对房产的需求,Manus自动帮你做房价和信息的整理;对英伟达和特斯拉股价生成分析报告。
要知道此前OpenAI的 Operator,以及智谱AI 的 Phone Use,都已经实机展示过类似的功能,而Google Gemini 在去年展示的,都已经是多模态的通过摄像头基于10分钟记忆来和你一起打游戏的 Agent 了。
如果熟悉主流的模型能力迭代方向,以及AI产品的现状的话,会很快意识到,这些场景和功能展示都在各种 Agent概念的产品里实现过,而且,Manus的界面也基本是 Devin 和 Artifact 的样子。
官方并没有任何对技术的详细报告,有人拆解了它背后的方法,基本是 Claude 的基础能力和开源模型的后训练后的规划能
力的结合,同时内置了各种 Agent 来通过某种已经设定的工作流来完成任务。
它有趣的地方在于,与此前大部分 Agent 类产品不同的是,Manus 把这些能力“封装”到了一个云端的虚拟环境,同时它也算是一个“异步”交互潮流里的新产品。
不过,这些开发工程上的创新,和业界今天已经在追求的端到端实现的“通用”方式有些远。
与用一长串文字来描述 Agent 相比,Anthropic 最近在一场分享中给 Agent 的定义更加清晰:Agents are models using tools in a loop——它首先要是一个强大的模型。作为目前 Agent 能力最强的模型,Claude 对“通用”的实现方式是强大的模型本身,加上一个通用的协议(MCP)。
这也指向 Manus 这类产品面对的一个问题,就是它的这些能力,本质上任何一个 Agent 能力强一点的模型就能干得了。而 Manus 也没有给出解决的方法。
想并肩 DeepSeek 不能靠自嗨和邀请码
但这些都不妨碍 Manus 成了一个小圈子里“刷屏”的产品。
从这个产品的设计来看,它就是瞄准了“普通用户”的套壳 Devin,把 Devin 变成用户不需要感知的产品过程的一部分,然后提供给用户更直接的用途,这样的产品其实在 Perplexity 走红后也被证明是有市场的。