专栏名称: 时代财经APP
聚焦于企业财经新闻,时代传媒集团出品。
目录
相关文章推荐
什么值得买  ·  上手华为阔折叠Pura X!真机比宣传图好看? ·  昨天  
什么值得买  ·  16种春日野菜尝鲜!打开看看你吃过几个? ·  2 天前  
命里有票  ·  喝不下了,今天的奶茶券是15-10 ·  2 天前  
命里有票  ·  喝不下了,今天的奶茶券是15-10 ·  2 天前  
每天发现一家店  ·  8 个我逢人就夸的好东西,好穿不贵! ·  4 天前  
每天发现一家店  ·  低价捡漏 - 0320 ·  2 天前  
51好读  ›  专栏  ›  时代财经APP

MetaGPT团队亲述:00后3小时复刻Manus

时代财经APP  · 公众号  ·  · 2025-03-11 12:04

正文


图源:视觉中国

作者 | 庞宇

编辑 | 罗丽娟


“开源永存。”这是MetaGPT研究员、OpenManus合作者向劲宇在面向时代财经等的分享中,留下的结束语。

近一周来,全球首款通用AI智能体——Manus爆火,成为科技圈持续热议的话题。

与此同时,Manus的开源替代方案如雨后春笋般冒出。国内初创公司DeepWisdom的MetaGPT团队,仅用3小时便利用开源框架复刻出OpenManus;开源社区CAMEL-AI团队也“0天”复刻出Manus通用智能体OWL……持续涌现的复刻浪潮似乎也向外界传递了一个信息:Agent(智能体)的门槛并非高不可攀。

Manus的“护城河”究竟有多深?Agent赛道的终极竞争力是什么?当业内普遍认为“2025年有望成为AI Agent爆发元年”时,这个赛道还有哪些待解难题?

近日,OpenManus核心作者向时代财经等分享了其中的故事,并给出了他们对于Agent的理解。


3小时复刻Manus团队:00后挑大梁


Manus发布当晚,向劲宇感受到身边的人都很兴奋,“大多数人的兴奋似乎来自于AI能使用电脑了。”

但在他看来,这样的功能在业内认识里并不是特别稀奇。

“比如Planning(规划)的能力在我们2024年的开源工作Data Interpreter(数据解释器)工作中已经有了相关的实现;而Computer Use和Browser Use等功能也在OpenHands(之前被称为OpenDevin,一个由AI提供支持的软件开发代理平台)以及智谱AutoGLM等各个工作中均有实现。”向劲宇说。

他判断,仅从一个demo(试用版)级别的实现来说,“搓”一个Manus开源版本给大家用“应该不是很难”。

MetaGPT研究员、OpenManus核心作者梁新兵迅速响应,并在第二天(3月6日)一早根据彼时已知信息对Manus做了一次完整调研,包括技术细节和分析。当天晚上下班后,向劲宇召集团队(向劲宇、梁新兵、张佳钇、于兆洋、洪思睿)讨论了Manus的产品形态和技术路线,决定加班赶出开源版本。

仅用了3小时左右,“大概(晚上)11点的时候,我们就把第一个版本合并开出去,然后挂到GitHub上面了。”向劲宇回忆。

发布不到1天,该项目已在GitHub上收获了7000多颗星星。“当时没想过OpenManus会爆火。”梁新兵说。

作为OpenManus核心作者,梁新兵研究生毕业于华东师范大学,之前曾参与爆火的AI Agent数据科学家Data Interpreter的开发工作。而向劲宇本科就读于西南交通大学应用物理系,去年,读大四的他和队友一起使用GPT-4与Claude 3组成多智能体的方案,让AI分饰多个角色、相互验证来完成答题步骤,获得了阿里巴巴数学竞赛AI赛道全球第二名。二人均是00后,同时在2024年7月加入MetaGPT团队。

直到现在,MetaGPT团队还对OpenManus引发的大量讨论,感到恍惚。

在OpenManus发酵了一天后,“早上十点半醒过来,看到微信三十多个添加好友,我就知道应该爆了,我想继续安心地补个瞌睡,但是怎么都睡不着,拿起手机,没想到消息已经回不过来了。”由锦秋基金牵头举办的分享会上,向劲宇向时代财经等分享道。

Manus是一款基于AI核心模型所开发的AI Agent(人工智能代理)。所谓AI Agent,其往往需要以大语言模型作为核心,并叠加规划(Planning)、记忆(Memory)、工具调用(Tools),从而通过解决任务逻辑连贯性的问题完成特定的跨系统任务。

据MetaGPT团队解构分析Manus来看,Manus是一个多智能体系统,它首先使用Planning Tool做规划,形成一个包含多个任务的线性结构的计划,然后顺序执行每一个任务,并动态分配给相应的Agent。Agent在执行每个任务的过程中,以ReAct(Reason+Act,推理和行动)循环的形式调用工具以完成每一个任务。

3小时便复刻了Manus,MetaGPT团队是怎么做到的?

向劲宇认为:“一个极简的Agent框架,应该是可插拔的Tools(工具)和 Prompt(提示词)的组合,之后我们沿着这个思路,写了一个完整的Agent迷你框架。”

据他介绍,决定一个ReAct Agent效果的关键是提示词引导和工具使用。在OpenManus中,Prompt控制了Agent整体的行为逻辑,Tools给定了Agent的行动空间,二者被定义就能完整诠释一个ReAct Agent。

“可插拔的优点是可组合,我可以把几个不同场景下的Tools组合到一起来创造一个新的Agent,定义也很方便,不需要单独写内部逻辑,只需要修改动作空间(Tools)。”向劲宇进一步解释。

在他看来,“我们的工作是把抽象做得更干净。提供丰富的工具集合,支持多种Agent通过装备工具集来灵活扩展在不同场景下的能力。”

这其中,规划能力很重要。因此,OpenManus继承了Manus的规划优势,通过Planning Tool实现任务分解,可以处理现实世界中的复杂问题。

MetaGPT团队分享的OpenManus工作流程

谈及OpenManus后续工作,梁新兵表示,接下来将从增强Planning能力、引入标准化评测、拓展模型适配(从Claude-3-5扩展到DeepSeek V2.5)、实现容器化部署等诸多方面来提升OpenManus的效果。

OpenManus是否能超越Manus?

“Manus产品交互做得挺好的,有很多技术也值得学习。目前OpenManus效果还很有限,我们还没有单独调效果。OpenManus 前期目标打算达到原始Manus的相同效果,后续会依靠庞大的开源社区不断优化。”梁新兵希望,这些优化能给OpenManus带来更高的智能涌现。


Manus的“护城河”有多深?


据Manus官方网站介绍,Manus能一键帮用户做旅行规划、股票分析、做PPT、财报分析等工作,涵盖研究、生活、数据分析、教育、生产效率等多个领域。

在官方放出来的视频中,Manus的表现也令人惊艳,能完全自主地完成从规划到执行的全流程。例如,在特斯拉股票分析任务中,Manus能在45秒内完成“数据抓取→建模→报告生成”的全链路操作。

简单而言,用户只需要输入简单的提示指令,一段时间之后,便可以得到一个完整的成品交付。

但MetaGPT团队仅用5人3小时,便通过开源框架复刻出OpenManus;开源社区CAMEL-AI团队也实现“0天复刻”,推出OWL并直接开源部分模块。这些都让“Manus缺乏技术壁垒”的质疑声不断。

据此前媒体报道,Manus的模型能力来自Anthropic的Claude。3月10日,Manus创始人季逸超在社交平台透露,Manus产品使用了不同的基于阿里千问大模型(Qwen)的微调模型。

有市场人士认为,随着大模型能力的持续增强,大模型会逐步将更多工具链的功能内化。未来大模型便能独立实现Manus期望达成的效果,而无需再繁琐地调用外部工具链。因此Manus耗费大量精力所创造的价值,大概率会被大模型的内生能力的增长所淹没。

一名AI领域的投资人士林亚秋(化名)也向时代财经表达了类似的观点,“当大模型能力变强,未来一些高频场景,有可能模型本身就能覆盖,大模型公司可能也会内置这些Agent。”

Agent诞生的必要前提是基座模型的性能提升,这是行业内的共识,但为什么率先获得注意力的会是Manus?

“Manus能最先跑出来,一方面是因为从今年春节前后开始,推理模型的技术取得了比较大的进展,这件事对Manus有非常大的帮助,因为只有在推理模型成熟的情况下才有机会做。”林亚秋向时代财经表示,“Agent有规划、工具调用和记忆这三个特点,每一点上的成功率都会影响它最终的成功率。而推理模型变强会令第一步也是最重要的一步——规划能力提升。”

另一方面,Manus创作团队本身也具备一定的实力。“他们的产品能力非常强,非常懂用户的需求,且在功能实现上做得很好。”林亚秋说。据她了解,Manus创作团队在之前的两年里一直在“产品能力”上表现得很好,这是他们团队擅长的事情。

图源:图虫

实际上,就算3小时实现复刻Manus的MetaGPT团队,也是基于MetaGPT在AI场景的自动化和智能体框架上多年的技术积累。

“从技术方案上来说,Manus使用了大量有业内共识的核心基础技术。但Manus本身是很好的作品,它在用户示例中展示了卓越的用户体验,以及很不错的整体交互效果。他们团队实现了复杂的规划,包括他们自己进行过Post Train的模型,提供了更好的效果和交互,也给我们提供了很多发展思路。”MetaGPT团队表示。

正如Manus团队的核心理念“Less structure, more inteligence(更少的结构,更多的智能)”,强调给予AI更多自主权以决定如何使用工具和完成任务,这种理念也体现在Manus的产品特性上,让用户体验更为出色。

事实上,Manus团队已声明,当前的Manus距离正式版想交付给大家的体验还差很远。“像模型幻觉、交付物友好度、运行速度等方面都还有很大的提升空间。”

Manus AI团队产品负责人张涛(HideCloud),同时也是Monica.im产品合伙人,近日在朋友圈发文表示,过去的十几个小时对于团队来说无异于一场充满各种意外的冒险,团队低估了大家的热情。这本是一个产品探索过程中的阶段性收获分享,因此服务器资源是对标demo水平来准备,不曾想过会引起巨大波澜。








请到「今天看啥」查看全文