专栏名称: 深度学习这件小事

机器学习算法、深度学习算法、自然语言处理等干货知识集中营

邀请码炒到10万？OpenManus深夜开源打脸！Manus X账号遭冻结，平替光速上线

深度学习这件小事 · 公众号 · · 2025-03-08 09:00

正文

大模型智能｜分享

来源 | 新智元

编辑 | 编辑部 JHNZ

昨天，所有人都被Manus刷屏了，一个邀请码已经被炒到了天价。

虽然被Manus强势刷屏，很多人却只能眼睁睁地看着，没法亲自上手体验，只因一码难求。

最新消息，就在刚刚，Manus AI的官方X账号已被平台冻结。

不过就在此时，开源界以迅雷不及掩耳之势上演了一波速度与激情——有这样一个项目，仅凭三小时的代码量，就掀翻了AI的高墙。

昨天晚上，GitHub开源了一个无需邀请码的OpenManus项目，刚刚开源不到一天，Star数就已经破千。

项目地址：https://github.com/mannaandpoem/OpenManus

现在，所有开发者都可以实测了。

其中最亮眼的，莫过于这句「只需修改config.toml即可开玩」，直接对封闭生态公开打脸。

创建环境，克隆项目并CD到目录，改一下config/config.toml里的大模型信息，再输入一行命令，就可以愉快地在terminal里体验了。


conda create -n open_manus python=3.12conda activate open_manus
git clone https://github.com/mannaandpoem/OpenManus.gitcd OpenManus
pip install -r requirements.txt
cp config/config.example.toml config/config.toml
# Global LLM configuration[llm]model = "gpt-4o"base_url = "https://api.openai.com/v1"api_key = "sk-..."  # Replace with your actual API keymax_tokens = 4096temperature = 0.0
# Optional configuration for specific LLM models[llm.vision]model = "gpt-4o"base_url = "https://api.openai.com/v1"api_key = "sk-..."  # Replace with your actual API key
python main.py

开源界3小时复刻Manus，跟邀请码说再见

来自国内的这支团队宣布：晚餐后2小时，OpenManus的核心功能直接开源！

没有邀请码，没有壁垒，这支团队用3小时的代码量，就把邀请码机制扫进历史垃圾堆，跟饥饿营销彻底说拜拜！

OpenMunus的作者均为MetaGPT的核心贡献者。

OpenManus的实现很简单，使用到了computer use、基本的智能体和规划。

就像在Manus中那样，任何人都可以使用OpenManus，把自己的想法变为现实。

无论在手机上还是OS上，如果想做Deep Research，只要提交你的问题，它就可以帮你实现了。

比如，我们可以给OpenManus这样一个任务：「对Karpathy的网站（https://karpathy.ai/）进行全面的SEO审核，并提供详细的优化报告，包括可执行的改进建议。」

OpenManus会展开思考，将自己的任务分解为如下几步。

首先，检查网站并收集基本信息
然后，分析关键的SEO要素
第三，检查技术性SEO方面的问题
最后，整理优化建议

明确任务细节后，OpenManus就打开Karpthy的网站，开始收集信息、展开详细分析。

整个思考过程，每一步都清晰可见。

最终，它生成了一份完整、详实的Karpathy个人网站优化报告。

其中，它提出的高优先级任务如下：Meta标签优化（如优化页面标题，使其包含相关关键词）、技术设置（如创建并提交XML站点地图）、内容优化（如为所有图片添加alt文本、在个人网站上实施Schema标记等）。

OpenManus的核心，就是一个革命性的模块化Agent系统，由高度智能的专业团队，组成了一个协作网络。

Manus主代理：项目经理，能理解用户需求，协调各个专业团队的工作。
PlanningAgent：战略专家，将复杂的任务分解为清晰可执行的步骤。
ToolCallAgent：技术专家，掌握各种强大工具的使用方法。

由此，开发者可以根据自身需要，自由组合不同的功能模块，创造出自己独有的AI助手。

OpenManus无缝集成了包括Claude 3.5、Qwen VL Plus在内的多个顶级大模型，开发者能充分利用各个模型的优势。

为何只用短短3小时，团队就能打破Manus的高墙垄断？

原因就在于，OpenManus其实源于MetaGPT的开源积累。

我们只是把浏览器工具链嫁接到过去代码上，配合沉淀的Agent工具包，核心系统1小时就完成了。

OpenManus的另一强大功能，就是它的实时反馈机制。

LLM思维链的过程，会被可视化地呈现出来。无论是任务执行进度的实时更新、思考过程日志、文件的即时通知等，都随时可见。

此外，OpenManus还配备了一套强大的工具链，能处理各种复杂任务。

Python代码执行器：实时生成和执行代码
网络搜索工具：自动获取和分析网络信息
浏览器自动化：模拟人类操作进行网页交互
文件处理系统：自动生成和管理各类文档

其中，这些工具都不是简单的独立模块，而是被精心设计的协同系统，在处理任务时能默契配合，高效完成任务。

实测生成一份关于Manus的报告

问题来了：OpenManus能成为Manus的平替吗？

OpenManus的开发者HKUST（GZ）博士生Jiayi Zhang上传了一段实测视频。

视频中他给出了这样一段提示：

深度调研和Manus这个Agent有关的信息，自己整理信息，然后写一个新闻html页面介绍它，你写的html应该尽可能美观。

接着OpenManus就开始干活了。它将这个任务分步进行，首先使用GoogleSearch搜索Manus Agent的相关信息。

在这个过程中还不断打出思考过程：「好的,让我们继续深入调研Manus,我会逐步访问搜索到的重要链接,收集信息,然后创建一个精美的HTML网页。」

它开始不断调用工具「browser_use」，访问不同的文章来搜集信息。

整理完信息，OpenManus再次输出：「现在让我们使用正确的完整路径来打开HTML文件：」渲染完后，它就给出了网页的链接。

打开后可以看到完整的报告。然而，OpenManus的能力还不止于此，在视频中，它被人要求继续完善这个页面，添加更多具体的技术细节和实际应用案例。

接着它就又开始调用起「google_search」以及「browser_use」这些工具，很快就重新给出了一个新的页面网址。

可以看出，OpenManus给出的这份关于Manus的报告，包括了Manus的诞生与发展、技术架构与创新以及实际应用案例与未来展望等。

虽然这份报告的结构看上去比较完整，但是细节还是有点乏善可陈。

Browser-use：让智能体直接操作浏览器

在OpenManus项目中，很重要的一项功能就是Browser-use。

Browser-use是一种使AI智能体能够操作浏览器的简单方式。它在GitHub上开源，许多项目都使用了它的功能，目前已经获得有超过35.8k个星星了。

项目地址：https://github.com/browser-use/browser-use

它通过提取网站的交互元素（如按钮、表单等），使AI能够自动化执行浏览器操作，例如填写表单、搜索信息或导航网页。这对于开发AI驱动的网络代理非常有用。

邀请码炒到10万？OpenManus深夜开源打脸！Manus X账号遭冻结，平替光速上线

正文

Browser-use：让智能体直接操作浏览器

请到「今天看啥」查看全文