专栏名称: 六合商业研选

六合咨询立足新经济，挖掘明日之星，发现价值，传播价值；国际化视野、多角度观察、深度思考、体系化研究，持续提升研究广度与深度，全面覆盖一级、新三板、二级（A股+美股+港股）；深度剖析优质企业商业模式与投资价值，前瞻性洞察行业本质与发展趋势。

【智能前线】第23期：Manus特辑，全球首款通用AI Agent，开启AI应用新范式

六合商业研选 · 公众号 · · 2025-03-12 06:30

正文

2025 年 3 月 6 日，中国 AI 创业公司 Monica ，发布全球首款通用 AI Agent 产品 Manus ，作为首个实现全流程自动化执行的智能体，能独立完成从任务拆解，到成果交付的闭环操作，覆盖金融分析、旅行规划等复杂场景。

Manus凭借云端自主执行、多智能体协同、持续学习与记忆等核心能力，在GAIA基准测试中，全面超越OpenAI Deep Research功能，验证在复杂任务处理上技术领先性，迅速引发行业关注。

Manus出现，代表大模型能力，进一步转化为可落地的商业应用，通过技术架构创新，为行业提供可复用的工程化模板，体现中国团队在AI应用层创新突破能力。

本期智能前线，选择Manus系列分析文章，包括产品分析、性能表现、用户测评、团队介绍等，极客公园、甲子光年、APPSO、数字生命卡兹克、赛博禅心发布，六合商业研选精校，分享给大家，Enjoy！

正文：

全文11,998字

预计阅读24分钟

AI Agent 的GPT时刻，Manus炸醒整个AI圈

时间：2025年3月6日

来源：极客公园

字数：4,161

离用户最近，做出最好的AI Agent。

2025年是AI Agent元年，在北京时间3月6日凌晨，得到应验。

DeepSeek 之后，又一个科技圈不眠之夜。

有人彻夜蹲守，只为该产品一个使用邀请码，它是Monica.im研发的全球首款AI Agent产品Manus。

团队介绍，Manus是真正自主的AI Agent，能够解决各类复杂多变任务。与传统AI Agent不同，Manus不仅能提供建议或答案，还能直接交付完整任务成果。

Manus 介绍视频，只有短短 4 分钟，威力惊人

正如Manus名字寓意，它在拉丁文里象征着手 。知识不仅要在脑子里，还要能用手执行。这正是Agent与AI Bot聊天机器人产品的本质进阶。

Manus牛在哪里？最直观的是看官方网站展示、用户自发展示的使用用例，极客公园部分整理如下：

旅行规划： 不仅整合旅行信息，还为用户创建定制旅行手册。

例如，为用户规划日本4月旅行，提供个性化旅行建议与详细手册。

股票分析： 进行深入股票分析，设计视觉上吸引人的仪表盘展示全面股票洞察。

例如，对特斯拉股票进行深度分析，创建可视化仪表盘。

教育内容创建： 为中学教师创建视频演示材料，解释动量定理等复杂概念，帮助教师更有效地教学。

保险政策比较： 创建清晰的保险政策比较表，提供最佳决策建议，帮助用户选择最适合的保险产品。

供应商采购： 在整个网络中进行深入研究，找到最适合用户需求的供应商，作为真正公平的代理为用户服务。

财务报告分析： 通过研究与数据分析，捕捉市场对特定公司，如亚马逊情绪变化，提供过去4个季度市场情绪分析。

创业公司列表整理： 访问相关网站，识别符合条件的公司，整理成表格。

例如，整理YC W25批次的所有B2B公司列表。

在线商店运营分析： 分析亚马逊商店销售数据，提供可操作的洞察、详细可视化与定制策略，帮助提升销售业绩。

当Agent通过一长串思维链与工具调用，最终输出无比完整、专业的结果时，用户们开始感叹真的能帮人类做事。

官方网站信息，在GAIA基准测试，评估通用AI Agent解决真实世界问题的能力中，Manus在所有3个难度级别上，都取得新的最先进SOTA表现。

Manus 更想做的，是你在数字世界中，字面意义上的代理人，它做到了。

Manus ，你的数字代理人

首先，Manus在体验上，与此前LLM最大不同：它强调直接交付最终结果的能力，不只是给出单纯的答案。

Manus 目前采用Multiple Agent架构，运行方式与此前Anthropic发布的Computer Use类似，完全运行在独立虚拟机中；可以在虚拟环境中调用各类工具，编写与执行代码、浏览网页、操作应用等，直接交付完整成果。

官方发布的视频中，介绍了3个Manus在实际使用场景中所完成的工作案例：

第一个任务是筛选简历。

15份简历中，为强化学习算法工程师职位，推荐合适的候选人，根据强化学习专业知识对候选人进行排名。

这个演示中，你甚至不需要给压缩文件解压、将简历文件一份份手动上传。

Manus 这时已经展现出人类实习生的一面，手动解压缩文件，逐页浏览每一份简历，记录重要信息。

Manus给出的结果中，不仅有自动生成的排名建议，还会根据工作经验等重要维度，将候选人分为不同等级。

在接受到用户更希望以Excel表格方式呈现后，Manus还能自动将这些内容通过现场编写Python脚本方式，生成对应表格。

Manus甚至还能通过记忆能力，在实践过程中，记录下用户更喜欢通过表格方式接受结果这样信息，下次处理类似任务结果时，会优先使用表格形式来呈现。

第二个案例，更为国人量身打造，是遴选房产。

案例中用户希望在纽约购买房产，输入要求是希望有安全的社区环境、低犯罪率，优质的中小学教育资源，包括最重要的预算，足够在每月固定收入情况下负担的起。

这个需求中，Manus AI将复杂任务分解为待办事项列表，包括研究安全社区、识别优质学校、计算预算、搜索房产等，通过网络搜索，仔细阅读有关纽约最安全社区的文章，收集相关信息。

Manus通过编写Python程序，根据用户收入，计算可负担的房产预算。结合房地产网站上相关房价信息，根据预算范围筛选房产列表。

Manus会整合所有收集的信息，撰写详细报告，包括社区安全分析、学校质量评估、预算分析、推荐房产列表、相关资源链接，类似专业的房地产经纪人一样。

Manus自带完全基于用户利益考虑的属性，使用甚至体验更好。

最后一个案例中，Manus展示对股票价格的分析能力。

案例给出的任务，分析过去3年中，英伟达、迈威尔科技、台积电股票价格之间的相关性：这三支股票之间存在紧密关联性，对新手用户，很难快速将因果关系整理清楚。

Manus 的操作，与真正的股票经纪人非常相似，它先是通过API访问雅虎金融等信息网站，获取股票历史数据，还会交叉验证数据准确程度，避免被单一信息来源误导，对最终产生结果带来重大影响。

这个案例中，Manus用到编写Python代码、进行数据分析、可视化的能力，还引入金融相关的专业工具进行分析，最终通过数据可视化图表，搭配详尽的综合分析报告方式，向用户反馈因果关系，真的类似金融领域实习生做的日常工作。

不仅如此，Manus官网还展示十多个Manus能够使用的场景：直接使用Manus帮你整理行程、个性化推荐旅游路线，还能让它学习使用各种复杂工具，来流程化的完成日常工作。

这个过程中，真正让Manus展现出与往常工具不同的，是它的自主规划，来确保执行任务的能力。

自主学习能力，让Manus工作能力提升逻辑，更类似真正的人类，即使现阶段，它可能还无法在某一特定领域做到专家级别精通，已经能看到巨大潜力。

随着自主学习能力加入，AI Agent泛用性得到巨大提升，在用户对Manus实际测试中，甚至可以做到直接对它描述一个视频画面中的相关内容，Manus最终能够直接根据对应的息，跨越平台内容对搜索引擎的限制，精准找到某个抖音短视频的链接。

目前版本Manus，完全基于云端异步运行，Manus能力并不被所使用的端侧平台形态或算力等因素限制，用户甚至可以做到在向Manus下达指令之后，暂时关闭电脑，当Manus执行完成活动结果后，会自动通知你结果。

这个操作逻辑非常眼熟，类似一个人下班以后，在微信喊实习生文件整理好发我。只不过，现在，实习生是真的可以7x24小时的响应，不用担心他会整顿职场。

多代理+自查，跑通AI Agent流

上面案例，不难看出Manus真正杀手锏，并非Computer Use中已经出现过AI Agent概念，而是它模拟人类工作方式的能力。

比起运行计算，Manus工作逻辑更类似思考、执行命令。它没有做到哪些人类当前真正无法做到的事,这也是为什么一些已经体验过当前版本Manus的用户，将它形容为实习生。

Manus官网，展示众多Manus能够完成的任务，就有一个案例，展示在B2B业务中，如何使用Manus。快速精准的将货需求，与全球供应商实现精准匹配。

在类似需求的常规产品中，在平台内整合全球供应链企业信息，帮助用户完成供货商/需求方匹配这件事，是业内通行的逻辑。这件事在Manus的案例中，能看到完全不同的实现方式。

Manus AI 使用Multiple Agent架构，运行在独立虚拟机中。通过规划代理、执行代理、验证代理的分工协作机制，大幅提升对复杂任务的处理效率，通过并行计算缩短响应时间。

这个架构中，每个代理可能基于独立的语言模型或强化学习模型，彼此通过API或消息队列通信。每个任务都在沙盒中运行，避免干扰其他任务，支持云端扩展。每个独立模型都能模仿人类处理任务的流程，比如先思考与规划，理解复杂指令，拆解为可执行的步骤，再调用合适的工具。

通过Manus这套多代理架构，它更像是由多个助理，通过协助方式，分别完成检索资源、对接、验证信息是否有效等工作，来完成整个工作流程，这不仅像是招了一个实习生，更像是直接当上微缩版的部门主管。

B2B 业务案例中，Manus通过网页爬虫、代码编写、执行能力，Manus会自动在互联网检索，根据你自己的需求，对潜在供应商从产品质量、价格、交货能力等方面，为你匹配到最合适的货源。不仅可以将结论以图表方式直观呈现在你眼前，还能对这些数据进一步给出更加详细的操作建议。

至于Monica团队到底如何、用何种技术实现的视频效果，根据消息，团队或将在北京时间3月6日为大家揭晓。

缝合的极致，是炸裂

Manus背后Monica.im，到底是什么公司？

Monica是款All-in-One的AI Agent，产品形态从浏览器插件、慢慢拓展至APP、网页端。主流使用场景是，当用户在浏览器中点开它的小图标，就能直接使用接入的各大主流模型。通过对细分场景用户需求的准确理解，Monica摘到大模型低垂的果实。

创始人肖弘，昵称小红，英文名Red，是位年轻的连续创业者，1992年生，毕业于华中科技大学。2015年，他毕业后创业，早期创业不算顺利，如校园社交、二手集市。2016年，他创业，为微信公众号运营者提供编辑与数据分析工具，获得百万用户、完成盈利，最终产品2020年出售给某独角兽公司。

等到2022年大模型浪潮后，他正式创立Monica，专注海外市场，通过独立开发者产品ChatGPT for Google，产品快速完成冷启动。

2024年，在GPT-4o、Claude 3.5、OpenAI o1系列上线的第一时间，Monica让用户可以获得最新SOTA模型。随着接入模型的新进展，Monica推出专业搜索、DIY Bot、Artifacts写小程序、记忆等功能也受到用户喜爱。

Monica在YouTube、Twitter、GmAIl、The Information等不同功能的网页里，呈现出不同的交互形态与功能，适配特定场景的用户需求，更新数百个网页的个性化AI体验。

2024 年，Monica用户数量翻番，达1,000万，保持着可观的盈利，在海外同类产品中，位居头部。

Monica 的强劲表现，验证了一件事：套壳到极致，既是TPF、也是PMF，最后都通往用户价值。

Manus 或许延续Monica团队思路，肖弘接受媒体人张小珺访谈时表示，产品不能只有聊天机器人一种形态，Agent会是新增的形态、需要新的产品承接。

他从AI编程产品cursor与Devin中获得灵感，极客公园了解，前者主要是copilot模式、后者是autopilot模式，后者更符合人性需求。

Agent 应该像Devin一样，面向大众人群、真正由AI主导进行执行。 过去问题是，模型不够聪明。

基于模型已有能力做场景的封装服务，或许正是Monica团队优势。

肖弘说，目前Agent产品团队不多，它需要很多复合能力，比如说团队要搞过chatbot、AI编程、浏览器相关都在浏览器上跑、对模型的边界要有不错感知，今天发展到什么水平，接下来会发展到什么样的水平等。

肖弘说，同时拥有这些能力的公司没那么多，有这些能力的公司，可能手头正在干一个很具体的业务，我们恰好有同学刚好有时间一起把这件事情做出来。。

肖弘总结道，为什么是Monica做出来，第一，我觉得我们比较幸运；第二，某种程度上，如果今天大家都做reasoning，可能是不是又多出一些时间给创业公司？模型预计能力外溢还能走多远？

他认为，目前Agent还在早期阶段。一是目前Agent还在规划阶段，还没到物理世界的执行；二是大模型能力还在往上发展，一切不可预料。

我肯定不知道Agent，是可以被用这样的方式设计出来，它是一个未知的事情。

耐人寻味的是，不知道怎么做Agent的Monica，现在做出让整个AI圈感到炸裂的产品。

Manus可能未必是最终的AI Agent，它无疑在DeepSeek爆火之后，再次将人们对AI的期望拉升一个数量级。

Manus 背后华人团队：套壳到极致，就是胜利

时间：2025年3月6日

来源：甲子光年

字数：2,364

Manus 是什么

Manus团队Hyan，在专注AI领域的在线学习平台与会员社区Superlinear Academy发帖，介绍称：Manus是全球第一款通用Agent产品，可以解决各类复杂多变的任务。

无论你需要深入市场调研、繁琐的文件批量处理、个性化的旅行规划，还是专业数据分析，Manus都能通过独立思考与系统规划，在自己虚拟环境中灵活调用各类工具，编写执行代码、智能浏览网页、操作各类网页应用，直接交付完整的任务成果，而非仅提供建议或答案。

Manus产品演示，已经近乎达到L4级别完全自动化水平，对个人工作流将带来底的生产力革命。

产品尚未公测，还是买家秀，大部分人不能体验。

Manus为什么出圈，除了本身炸裂的产品能力，背后华人团队让很多人惊喜的一点。

Manus背后团队名为Monica.im，创始人弘，连续创业者。

Monica在2023年开发AI浏览器插件助手Monica。更早之前，肖弘开发两款企业微信SaaS工具，微伴助手、壹伴助手，很多媒体与自媒体工作者日常用到的工具。

Monica团队本身不自研大模型，基于业内大模型开发套壳产品，这是他们成功的秘诀之一。很多人把目光聚焦在OpenAI、DeepSeek等基础大模型进展时，Monica团队悄悄从应用层暗渡陈仓。

业内对产品套壳似乎有种鄙视链，Monica团队正在证明：套壳到极致，就是胜利。

从壹伴助手到Manus

肖弘，华中科技大学软件工程专业2015届校友，连续创业者，具备10年以上技术创业经验。在校期间，肖弘加入联创团队，积极参与项目实践，带领团队先后推出志愿填报助手、咩咩、圈子集市等校园创新产品，为创业之路打下基础。

2015年，肖弘毕业后，创立夜莺科技，开发企业微信SaaS工具，微伴助手、壹伴助手，获腾讯等基金与投资机构数亿元投资，服务超200万B端用户，帮助企业触达数亿C端用户。2020年，该产品在出售给某独角兽公司。这一阶段创业经历，验证依附超级平台做垂直工具的商业模式可行性。

2022年，肖弘敏锐洞察到ChatGPT开启AI技术革命，成立蝴蝶效应公司，推出AI浏览器插件Monica，主攻海外市场。

Monica是基于浏览器的插件工具，主打个人日常通用的AI能力all-in-one，是款纯AI范式应用。

Monica集成当前主流大模型，可以与Monica随时随地聊天、翻译、处理文案、作图等。

Monica定位，肖弘认为Monica现在是具有通识能力的AI Agent，通过浏览器插件形式提供功能，可以帮助用户获取、处理与存储信息。未来，Monica将是个性化个人助手。

肖弘战略选择，源于两点判断。一是规避国内竞争，避开与百度、阿里等互联网平台直接交锋，聚焦欧美用户需求；二是技术套壳的价值重构，认为应用类公司比消费电子公司，如苹果，通过整合大模型API创造差异化体验，而非追求底层技术颠覆。

Monica出海战略：国内To B创业较多，出海To C较多。中国创业者做To C的出海能力，已经比5~6年前强很多。比如Monica.im等，都是在非常短时间内，在海外To C领域获得很多用户关注。

2023年，Monica通过收购独立开发者产品ChatGPT for Google，实现用户快速增长。该插件当时已积累300万用户，收购后与Monica形成产品矩阵。此举不仅缩短开发周期，还验证工具全家桶模式的用户需求。

目前，Monica已积累用户数约400万，ChatGPT for Google用户数约300万，总用户突破700万，在AI Chrome插件的产品中，用户范围与体量、功能广度均属于第一梯队。

2024年10月，肖弘在分享时，鼓励创业者专注解决具体技术问题，不是空谈宏大想法，强调在顺利时做出正确抉择的重要性。

2025年3月6日，Monica团队再次出发，发布震撼科技圈的AI Agent 产品Manus。官网介绍，这是比OpenAI Deep Research更强的AI Agent产品。

less structure more intelligence

无论Monica，还是Manus，都是套壳到极致的产品。

作为AI产品层的创业公司，肖弘不追求自研大模型，通过多模型动态调用GPT-4、Claude3、Gemini提升综合能力。

Manus没有透露背后调用的基础大模型名字，应该也是不同大模型搭配使用。

肖弘认为套壳不可怕，关键在于是否能够解决用户问题。他将大模型公司类比为芯片公司，应用公司类似消费电子公司。

芯片公司专注生产更优质、更具性价比的芯片，消费电子公司更注重品牌、渠道、为用户提供差异化的体验。

对消费电子公司，核心任务是为用户创造价值，实现商业闭环。

套壳可以视为整合与优化资源的方式，只要能够满足用户需求，提供良好的用户体验，套壳是成功的产品策略。

肖弘认为，套壳到极致，既是技术产品化TPF，也是产品市场契合PMF，最终都通往用户价值。

Monica团队，通过将大模型能力与用户需求紧密结合，为用户提供高效、便捷的AI服务。

例如，Monica在YouTube、Twitter、Gmail、The Information等不同功能网页里呈现出不同的交互形态与功能，适配特定场景的用户需求。

这种对用户需求的深刻理解与精准满足，使得Monica在海外市场取得显著成功，用户数量翻番，保持可观的盈利。

并非所有人都认同套壳的产品观。在近期上海GDC大会上，MiniMax副总裁刘华在一场论坛上建议，做AI产品不要雕花，底层模型的升级更加重要。

刘华用DeepSeek与MiniMax的Talkie举例，DeepSeek在2周内用户过亿，比ChatGPT的两周还要快，最核心原因是底层模型V3/R1带来的能力质的飞跃。

Talkie在海外用户体量，已经将最大竞争对手Character.ai远远甩开，原因是Character.ai基础模型团队被谷歌收购，MiniMax基于模应一体会有更高效产品迭代。

MiniMax认为基础大模型的能力，要远比AI应用层的产品雕花更接近本质。

套壳与否，只是技术层的理念，肖弘强调，产品核心在于解决用户问题。

Monica团队在开发产品时，始终将用户需求放在首位。他们通过将复杂技术实现封装在云端，为用户呈现简洁直观的操作界面。

例如，Monica让用户无需理解Python依赖管理、API密钥配置等技术细节，就能驱动AI完成复杂任务。这种用技术对抗技术的反直觉设计，极大降低用户使用AI技术门槛，使用户能够更加轻松享受到AI带来的便利。

产品发布之后，Manus团队Hyan在Superlinear Academy介绍Manus产品哲学：

我们坚信、践行less structure more intelligence哲学：当你数据足够优质、模型足够强大、架构足够灵活、工程足够扎实，computer use、deep research、coding agent等概念，就从产品特性，变为自然涌现的能力。

把任务留给Manus，把时间专注在更有创造性的工作，在任务过程中，可实时通过移动端查看任务执行状态，当你回来时，Manus将呈现令人满意的结果。

2025年被称为AI Agent之年，一场影响所有人工作流的AI革命正式拉开。

这个中国AI产品一夜刷屏，全网都在要邀请码，可能是DeepSeek后最大惊喜

时间：2025年3月6日

来源： APPSO

字数：2,737（有删减）

科技圈被Manus产品刷屏，这是全球首款真正意义上通用AI Agent，从官网展示的案例可以看到，它能够独立思考、规划、执行复杂任务，直接交付完整成果。

比起Claude的Computer use等同样能操作多任务，或者能帮点外卖、订酒店的Agent，Manus可以覆盖更多领域与达成更高执行质量。

Manus在权威的GAIA基准测试中创下新纪录，性能远超OpenAI同类产品。

Manus 字来自拉丁语，Mens et Manus，是mind and hand，即手脑并用。 这也是麻省理工学院的校训，以此鼓励学生将创意落地为实际成果。

创始人肖弘在Manus发布前几个小时，在即刻平台上发文高潮来临，分享莎士比亚一段书摘。

很难现在就判定Manus诞生是AGI里程碑，它很有可能将让Agent智能体时代真的进入高潮时刻。

Manus 体验申请链接： https://manus.im/invitation

筛简历、选房炒股，Manus真会干活？

官方宣称，Manus不仅是只会聊天的对话式AI工具，而是真正的自主智能体Agent。当其他AI可能只停留在生成想法的阶段，Manus能够独立思考并采取行动。

官方将其视为人机协作新范式，甚至可能是通向AGI的口。

与Manus同步出圈的，还有一段长达4分钟的演示demo。

这些案例中，Manus完全自主完成从规划到执行的全流程，展示真正的Agent能力，而非简单的助手功能。

比方说，首先从常见的人力资源任务，筛选简历开始。

另一个演示案例中，结合家庭收入情况与孩子的上学要求，让Manus在纽约筛选一个安全、犯罪率低的社区，并购买符合标准的房产。

面对这类复杂任务，Manus有条不紊地将其拆解为多个步骤，创建详细的待办清单。

转场到第3个案例，Manus摇身一变成专业的股票分析师。让其分析英伟达、迈威尔科技，、台积电在过去3年的股票价格之间的相关性，Manus可以通过API访问权威数据源。在验证数据后，它开始编写用于数据分析与可视化的代码。

官方表示，以上展示的内容仅仅是Manus能力的冰山一角。官网https://manus.im/usecases，还分享Manus更多处理现实世界任务的案例。

从个性化旅行规划、深度股票分析、保险政策比较、供应商采购、财务报告分析到专业数据整理等，Manus都能应付自如。

Manus尚未全面开放，热度已席卷全网。各大平台上，网友们纷纷深夜涌入评论区，询问邀请码，火爆程度可见一斑。

用于评估通用AI Agent，在解决现实世界问题方面能力的GAIA基准测试中，Manus在所有3个难度级别上都达到SOTA水平。

为确保结果的可重复性，Manus使用与其正式版本完全一致的配置进行评测。

除了基准测试，Manus还在Upwork与Fiverr等平台解决真实世界的问题，在Kaggle竞赛中证明自己实力。

这一切都离不开优秀的开源社区，官方希望能回馈社区。Manus采用多重签名multisig系统，由多个独立模型驱动。

2025年晚些时候，官方将计划开源一些模型，特别是Manus的推理postering部分。

中国团队、多款爆品、百万用户那么这款震撼业界的产品背后是谁？

Manus AI背后创始人肖弘，是华中科技大学软件工程专业2015届校友。

毕业后，他连续创业，2015年创立夜莺科技，推出壹伴助手与微伴助手，服务超200万B端用户，获腾讯、真格基金等投资。萦绕在肖弘身上的还有一个更鲜明的AI产品，Monica。这是款号称All-in-One的AI Agent，最初以浏览器插件的形式推出。

通过集成主流大模型，如Claude 3.5、DeepSeek等，Monica提供聊天、翻译、文案处理等功能，用户可通过自然语言创建定制化工具，共享至工具广场。

Monica同样早期以海外市场为主，用户规模破百万，成为AI插件领域头部产品。

2025年2月，Monica中文版monica.cn已开启内测，目前免费向国内用户开放。

该版本基于DeepSeekR1与V3模型打造，具备深度推理思考能力，支持记忆功能与实时联网搜索。

Manus技术哲学：less structure more intelligenceManus奉行的技术理念与主流也有些不同，是更少的结构，更多的智能。

他们认为，当数据足够优质、模型足够强大、架构足够灵活、工程足够扎实时，computer use、deep research、coding agent等能力会自然涌现，无需被设计为特定的产品功能。

作为大力出奇迹的代表之一，GPT-4-Turbo在GAIA公开排行榜上的平均成绩不到7%，即使是使用复杂多智能体系统的解决方案也仅达到40%，Manus的表现可以说是遥遥领先。

创始人肖弘在最近与张小珺访谈中，他提前谈到当时还未发布的Agent产品Manus。看上去它应该是chatbot，这是很符合大家想象的，同时在应用侧很复杂，与Monica不一样，光用好不同模型就挺复杂。

肖弘将目前AI应用分为两类：一是填补主要应用产品空档的不足，二是为特定场景提供独特解决方案的应用。

比如Perplexity提供联网搜索功能，与Monica浏览器插件形态都属于此类，它们填补现有产品留下的空白。

模型驱动的新场景这类应用，主要出现在图片与视频领域，直接由模型技术的进步驱动。

像Pika与Runway等产品，利用模型能力，创造新的应用场景。

有用户调侃Manus是极致的套壳是牛逼，肖弘不忌讳让用户知道自己产品用的是别人模型。

早在2024年，他把Monica比作消费电子产品，把ChatGPT的Logo打在官网。

人机交互新时代已来，别急着把Manus捧上AGI神坛

APPSO在2024年初曾作出一个预测：大模型将成为智能手机新的操作系统，自然用户界面NUI（Natural user interface），将逐步替代现有的图形用户界面GUI。

实现这种新交互的重要入口，是Agent。

2024年，我们在很多手机的发布会上都看到类似案例。

vivo发布会展示可以AI订餐的Phone GPT，华为鸿蒙的小艺与意图框架，还是荣耀的YOYO智能体，智谱的AutoGLM，核心都是一样的：让AI模仿人类的Plan-Do-Check-Act计划-执行-检查-行动循环，像人类操作设备。

智谱AI CEO张鹏之前提到，目前Agent能力，更像是在用户与应用之间，增加能的调度层，链接所有应用，甚至是所有设备。

这可以看做是大模型通用操作系统LLM-OS的一种雏形，将对人机交互形式产生极大的影响。

OpenAI创始成员Andrej Karpathy，曾多次谈到大语言模型操作系统LLM OS，他认为大模型某种程度是一种新的计算机与操作系统，可以连接各种软件与硬件，所有模态信息组成的外设，通过函数调用执行各种任务。

传统操作系统中，需要围绕CPU构建一堆外设，比如鼠标与键盘、磁盘存储、缓存空间等。

在LLM OS中，大模型本身是中央处理器。 I/O外设不再是鼠标与键盘，LLM可以兼容更多模态的数据输入与输出。

大模型调用的外部工具，将从传统软件升级为智能体工具。跨应用的操作，是非常关键的一环，意味着Agent能实现更加复杂的自主连贯操作，可能走向真正的商业化落地。至于各家互联网公司提供的服务能否打通，可能是未来实现这种交互最大的障碍。

现在很多AI Agent实现代操作的方式，是调用手机的无障碍功能accessibility features的权限，来控制屏幕点击。

Manus 的出现，意味着Agent模式下，AI能够理解需求后独立工作，直到任务完成。

这无疑是人机交互领域的一大步，它让我们看到AI从工具向伙伴转变的潜力。

但要说我们已经一只脚迈入了AGI大门，也还为时尚早。肖弘提到，早期Agent更像是功能机，需要不断迭代与完善。

目前Agent仍需依赖模型能力提升，更完善的虚拟环境支持，才能真正胜任各种长尾任务。

如果类比智能驾驶，大概相当于从L2级，升级到L3级辅助驾驶。

Manus在GAIA基准测试中表现出色，并不意味着已具备AGI全部特征。

通往AGI的道路依然漫长，需要解决模型能力、自主学习、任务泛化等多重挑战。

但有了Manus在自主性与通用性上的突破，通往AGI的大航海中，又多了一颗照亮我们的星。

一手体验首款通用Agent产品Manus

时间：2025年3月6日

来源：数字生命卡兹克

字数：1,570（有删减）

新团队突然发了款通用行的项目：Manus，是OpenAI Deep Research与Claude Computer Use的究极集合体，甚至还能自己写代码，直接Coding Agent。

已经超越OpenAI的Deep Research，成为GAIA评分第一。General AI Assistants是面向通用AI Agent能力的基准评测体系，由Meta AI、Hugging Face等研究团队2023年提出。

有一篇非常著名的论文：

里面有466个精心设计的问题。传统的测试一般都是数学AIME或者一些专业知识问答、编程等，GAIA测试，里面很多都是概念简单，需要多步骤解决的实际问题；分为3级别，Lv.1、Lv.2、Lv.3，难度依次递增。

想通过GAIA的测试，一般需要网络检索能力、工具调用能力、编程能力、文件处理能力等。

2023年时，人类一般能达到90%成功率，那时最强AI GPT-4，在第一级才勉强达到15%。

Manus这波，把Deep Research干碎，它之前已经是最强。

即使是没有拿到邀请码的用户，也可以去Manus官网，大概看一下seCase，每一个，都非常的有意思。

如果有了邀请码，正常登录进去以后，是大的界面：

都是一个对话框，Manus能力不太一样，不是那个提出个问题，AI一会就会直接给你回答Chatbot。

而是出问题之后，他会根据问题与要求，拆解任务，进行极度复杂的任务规划与执行。

会在云端自动运行，你可以直接退出去，等运行完，会通知你。

比如之前那篇GAIA论文，我想把PDF变成能拿出去讲的PPT，我把这个要求提给Manus的时候，他会先把我需求拆解。

我是这么说的：1、我希望你写一段Python程序，用OCR把这篇论文的PDF信息提取出来。2、将PDF里面信息总结成PPT大纲。3、按照小米发布会的风格，做一份给普通人科普用的PPT。4、给我PPT的下载文件。

他会开始花一点时间来理解。

【智能前线】第23期：Manus特辑，全球首款通用AI Agent，开启AI应用新范式

正文

请到「今天看啥」查看全文