投资事件:
2025年3月6日,Monica团队发布全球首款通用Agent产品Manus。在GAIA Benchmark基准中,Manus的表现达到了SOTA:Level 1 86.5%(OpenAI Deep Research为74.3%)、Level 2 70.1%(OpenAI Deep Research为69.1%)、Level 3 57.7%(OpenAI Deep Research为47.6%)。
多
Agent
架构、多工具集成共同支持复杂任务执行能力
。
Manus
并非简单的问答式
AI
,其核心优势在于能够自主规划并执行复杂任务。
Manus
拥有规划代理、执行代理和验证代理三个核心模块的多
Agent
架构。规划代理负责将用户的模糊需求分解成一系列可执行的子任务,并制定相应的执行计划。执行代理则根据计划,调用各种外部工具(例如代码编辑器、浏览器、特定应用程序等)来完成各个子任务。最后,验证代理会对执行结果进行检查,确保最终输出符合用户的预期。这种拆分机制,使得
Manus
真正具备了执行复杂任务的能力。
意图理解与交互能力强,反馈机制提升可用性
。
1
)借助
LLM
推理提升用户意图理解能力,即使面对含糊不清或不完整的指令,也能通过上下文理解和推理,自动补充缺失信息,并制定合理的执行方案。
2
)反馈机制完善,能够实时向用户汇报任务的执行进度和结果,并及时处理可能出现的错误。这种流畅的交互体验大幅降低了用户使用门槛,在低代码开发、工作流程自动化等场景也将有更多应用潜力。正如
Manus
团队相信的
less structure more intelligence
哲学所言,当数据足够优质、模型足够强大、架构足够灵活、工程足够扎实,
Computer Use
、
Deep Research
、
Coding agent
等产品概念就将成为自然涌现的能力。
Manus
或将标志通用
Agent
商业化元年到来。
B
端
Agent
可以看作一种有决策能力的
RPA
、或者能够与外部环境交互的
LLM
,短期能够大幅简化用户工作流程实现降本增效,在
Coding
、营销、
HR
招聘等场景已有高价值量的应用落地;长期能够直接在业务端创造价值,或为决策赋能。
Agent
瞄准和替代的绝不仅是传统软件市场,而是以万亿美元计的服务市场。通过将服务转化为软件(
Service-as-a-Software
)的模式,
Agent
为代表的应用模式将创造远超传统软件的价值量。或许从此刻起,以
Manus
为代表的通用
Agent
产品也将开始走向商业化。