专栏名称: APPSO
让智能手机更好用的秘密。
目录
相关文章推荐
APPSO  ·  苹果发布两款 AI 电脑!一款自砍 ... ·  19 小时前  
APPSO  ·  ChatGPT ... ·  昨天  
51好读  ›  专栏  ›  APPSO

这个中国 AI 产品一夜刷屏!全网都在要邀请码,可能是 DeepSeek 后最大惊喜

APPSO  · 公众号  · app  · 2025-03-06 06:06

主要观点总结

文章介绍了名为Manus的通用AI Agent,它在全球范围内引起了广泛关注。Manus具备独立思考、规划并执行复杂任务的能力,且性能远超其他同类产品。文章详细描述了Manus的功能和特性,包括其处理现实问题的能力以及在GAIA基准测试中的表现。此外,文章还探讨了Manus背后的技术理念以及人工智能助手的发展趋势。

关键观点总结

关键观点1: Manus是首款真正意义上的通用AI Agent,具备独立思考和高效执行的能力。

Manus能够覆盖更多领域并达成更高执行质量的任务,性能在GAIA基准测试中创下了新纪录。

关键观点2: Manus的应用范围广泛,包括筛选简历、选房炒股、旅行规划、深度股票分析等。

Manus能够像专业招聘人员一样高效筛选简历,还能处理复杂的金融分析任务。

关键观点3: Manus的技术理念是“less structure more intelligence”,注重智能的涌现。

Manus奉行的技术理念与主流有所不同,认为当数据、模型、架构和工程达到一定程度时,智能能力会自然涌现。

关键观点4: Manus的出现对人机交互产生了重大影响。

Manus展现了AI从工具向伙伴转变的潜力,是通往AGI道路上的一颗明星。目前的人工智能助手正在向更加智能和自主的方向发展,可能会对传统的人机交互方式产生极大的影响。


正文

几乎在昨晚苹果发布新品的同时,整个科技圈却被一个名为 Manus 的产品刷屏了。
这是全球首款真正意义上的通用 AI Agent,从官网展示的案例可以看到,它能够独立思考、规划并执行复杂任务,直接交付完整成果。
比起  Claude 的 Computer use 等同样能操作多任务,或者能帮你点外卖订酒店的 Agent, Manus 可以覆盖更多领域和达成更高的执行质量。

Manus 在权威的 GAIA 基准测试中创下新纪录, 性能远超 OpenAI 的同类产品。

而 Manus 这个名字来自拉丁语,Mens et Manus,就是 mind and hand,即手脑并用。 这也是麻省理工学院的校训,以此鼓励学生将创意落地为实际成果。
创始人肖弘在 Manus 发布的前几个小时,在即刻平台上发文「高潮来临」,并分享了莎士比亚的一段书摘:
很难现在就判定 Manus 的诞生就是 AGI 的里程碑,但它很有可能将让 Agent (智能体)时代真的进入「高潮时刻」。
Manus 体验申请链接 👇:
https://manus.im/invitation
筛简历、选房炒股,Manus 真会「干活」?
官方宣称,Manus 不仅仅是一个只会聊天的对话式 AI 工具,而是一个真正的自主智能体(Agent)。
当其他 AI 可能只停留在生成想法的阶段,而 Manus 能够独立思考并采取行动。官方将其视为人机协作的新范式,甚至可能是通向 AGI 的一个窗口。
与 Manus 同步出圈的还有一段长达四分钟的演示 demo。在这些案例中,Manus 完全自主地完成从规划到执行的全流程,展示了真正的 Agent 能力,而非简单的助手功能。
比方说,首先从一个常见的人力资源任务——筛选简历开始。
演示一开始就放了个大招,官方向 Manus 发送了一个包含 10 份简历的压缩文件,Manus 能像专业招聘人员一样高效工作。
它会先解压文件,然后逐页浏览每份简历,并记录重要信息。 Manus 还能异步处理文件,这意味着你可以随时关闭电脑,等任务完成后,它会通知你。
当然,在这个过程中,你也可以随时给它新的指令。
接着,继续向 Manus 上传 5 份简历。在认真阅读了所有 15 份简历后,Manus 给出了排名建议,并提供了候选人资料和评估标准作为参考。
这还没完,我们还可以让 Manus 生成电子表格。
由于 Manus 具有知识和记忆能力,所以下次执行类似任务时,它会直接以电子表格的形式交付结果。
另一个演示案例中,结合家庭收入情况和孩子的上学要求,让 Manus 在纽约筛选一个安全、犯罪率低的社区,并购买符合标准的房产。
面对这类复杂任务,Manus 同样是有条不紊地将其拆解为多个步骤,并创建详细的待办清单。

搜索并阅读关于纽约最安全社区的文章。

研究纽约的中学情况。

编写 Python 程序来计算预算。

基于预算,在房地产网站上筛选合适的房源。

整合所有信息,撰写详细报告并整理相关资料
转场到第三个案例,Manus 摇身一变成了专业的股票分析师。
让其分析英伟达、迈威尔科技,以及台积电在过去 3 年的股票价格之间的相关性,Manus 可以通过 API 访问权威数据源。在验证数据后,它开始编写用于数据分析和可视化的代码。
在完成数据分析和可视化后,Manus 也能基于这些数据创建一个网站。经用户的授权后,还能将网站部署至线上,并提供了一个可供分享的链接。
X 网友 @DavidAIinchina 体验 Manus 过后,给出了极高的评价——「令人难以置信的用例」。

官方表示,以上展示的内容仅仅是 Manus 能力的冰山一角。
官网 (https://manus.im/usecases) 还分享了 Manus 更多处理现实世界任务的案例。从个性化旅行规划、深度股票分析、保险政策比较、供应商采购、财务报告分析到专业数据整理等,Manus 都能应付自如。
尽管 Manus 尚未全面开放,但其热度已席卷全网。 各大 平台上,网友们 纷纷深夜 涌入评论区 询问 邀请码,其火爆程度可见一斑。
而在用于评估通用 AI 助手在解决现实世界问题方面的能力的 GAIA 基准测试中,Manus 在所有三个难度级别上都达到了 SOTA 水平。
为了确保结果的可重复性,Manus 使用与其正式版本完全一致的配置进行评测。
除了基准测试,Manus 还在 Upwork 和 Fiverr 等平台上解决真实世界的问题,并在 Kaggle 竞赛中证明了自己的实力。
而这一切都离不开优秀的开源社区,因此官方也希望能回馈社区。
Manus 采用多重签名(multisig)系统,由多个独立模型驱动。今年晚些时候,官方将计划开源其中的一些模型,特别是 Manus 的推理(postering)部分。
中国团队、多款爆品、百万用户
那么这款震撼业界的产品背后是谁?
据悉,Manus AI 背后的创始人肖弘是华中科技大学软件工程专业 2015 届校友。
毕业后,他连续创业,2015 年创立夜莺科技,推出「壹伴助手」和「微伴助手」,服务超 200 万 B 端用户,获腾讯、真格基金等投资。
萦绕在肖弘身上的还有一个更鲜明的 AI 产品——Monica。
这是一款号称 All-in-One 的 AI 助手,最初以浏览器插件的形式推出。
通过集成主流大模型(如 Claude 3.5、DeepSeek 等),Monica 提供聊天、翻译、文案处理等功能,用户可通过自然语言创建定制化工具,并共享至工具广场。
Monica 同样是早期以海外市场为主,用户规模破百万,成为 AI 插件领域头部产品。
今年 2 月份,Monica 的中文版(monica.cn)已开启内测,目前免费向国内用户开放。该版本基于DeepSeek R1 和 V3 模型打造,具备深度推理思考能力,并支持记忆功能和实时联网搜索。
Manus 的技术哲学:less structure more intelligence
Manus 奉行的技术理念与主流也有些不同,是 「less structure more intelligence.」(更少的结构,更多的智能)
他们认为,当数据足够优质、模型足够强大、架构足够灵活、工程足够扎实时,computer use、deep research、coding agent 等能力会自然涌现,无需被设计为特定的产品功能。
作为大力出奇迹的代表之一,GPT-4-Turbo 在 GAIA 公开排行榜上的平均成绩不到 7%,即使是使用复杂多智能体系统的解决方案也仅达到 40%。Manus 的表现可以说是「遥遥领先」。
创始人肖弘在最近在和张小珺的访谈中,他也提前谈到了当时还未发布的 Agent 产品 Manus 。
「看上去它确实应该就是一个 chatbot,这是很符合大家想象的,同时在应用侧却很复杂,和 Monica 不一样,光用好不同模型就挺复杂。」
肖弘还将目前 AI 应用分为两类:一是填补主要应用产品的空档的不足,二是为特定场景提供独特解决方案的应用。
比如 Perplexity (提供联网搜索功能) 和 Monica (浏览器插件形态) 都属于此类,它们填补了现有产品留下的空白。
而模型驱动的新场景这类应用,主要出现在图片和视频领域,直接由模型技术的进步驱动。像 Pika 和 Runway 等产品利用模型能力创造了新的应用场景。
有用户调侃 Manus 是「极致的套壳就是牛逼」,实际上肖弘并不忌讳让用户知道自己的产品用的是别人的模型。早在去年,他就把 Monica 比作消费电子产品,并把 ChatGPT 的 Logo 打在官网。
人机交互新时代已来,但别急着把 Manus 捧上 AGI 神坛
APPSO 在 2024 年年初曾作出一个预测:大模型将成为智能手机新的操作系统,自然用户界面(Natural user interface, NUI )将逐步替代现有的图形用户界面(GUI)。
而实现这种新交互的重要入口,就是 Agent 。
去年我们在很多手机的发布会上都看到类似的案例。vivo 发布会展示可以 AI 订餐的 「Phone GPT」,华为鸿蒙的小艺和意图框架,还是荣耀的 YOYO 智能体,以及智谱的 AutoGLM,核心都是一样的:






请到「今天看啥」查看全文