专栏名称: 架构师
架构师云集,三高架构(高可用、高性能、高稳定)、大数据、机器学习、Java架构、系统架构、大规模分布式架构、人工智能等的架构讨论交流,以及结合互联网技术的架构调整,大规模架构实战分享。欢迎有想法、乐于分享的架构师交流学习。
目录
相关文章推荐
科学家庭育儿  ·  没想到,孩子会不会骑自行车居然是幼升小其中一 ... ·  14 小时前  
丁香妈妈  ·  灰指甲不想传染给孩子,一定要趁早治疗 ·  4 天前  
丁香妈妈  ·  宝宝湿疹会自愈吗? ·  3 天前  
科学家庭育儿  ·  速查!40批次童装抽检不合格,娃的贴身衣服里 ... ·  2 天前  
51好读  ›  专栏  ›  架构师

三大开源Manus复刻项目全景解析

架构师  · 公众号  ·  · 2025-03-07 22:28

正文

架构师(JiaGouX)
我们都是架构师!
架构未来,你来不来?




引言:当邀请码遇上开源利刃


Manus的封闭生态与天价邀请码,意外点燃了开源社区的创造力之火。

今天,三支技术团队以截然不同的路径,撕开了AI Agent领域的技术黑箱——这场看似“复刻”的运动,实则是开源力量对垄断式创新的集体反击。


一 、 MetaGPT/OpenManus:模块化架构的闪电战

核心战绩 : 3小时完成核心系统重构

GitHub: mannaandpoem/OpenManus

https://github.com/mannaandpoem/OpenManus

技术架构解析

  • 三重代理协作

    • 主代理(Conductor) :需求理解与任务分发

    • 规划代理(Planner) :将“撰写市场报告”拆解为数据采集→清洗→分析→可视化四阶段

    • 工具代理(Executor) :精准调用15+工具(见下表)

工具类目 典型能力 风险提示
PythonExecute 执行系统命令/文件操作 无沙箱防护,慎用rm -rf
BrowserControl 自动化登录/验证码绕过 需手动配置代理IP
GoogleSearch 支持高级检索语法(site: filetype:) API调用频次限制

新增技术细节

  • 基因溯源 :基于MetaGPT开源沉淀的200+预制组件,浏览器工具链嫁接仅需1小时

  • 实时思维链追踪


    [PlanningAgent] 将"用户季度报告生成"分解为:
    1. 爬取销售数据(PythonExecute)
    2. 市场趋势分析(GoogleSearch+数据分析)
    3. 自动生成PPT(FileSaver+模板引擎)
    [执行追踪] ToolCallAgent调用ChromeDriver时遭遇验证码,自动切换代理IP...
  • 模型热插拔 :支持Claude 3.5、Qwen VL Plus等多模型无缝切换,通过 config.toml 一键配置

开发者实战指南


# 四步极简部署(Windows示例)  
python -m venv myenv # 创建虚拟环境
myenv\Scripts\activate # 激活环境
pip install -r requirements.txt # 安装依赖
python main.py --task "整理销售数据" # 启动任务

核心团队 :DeepWisdom算法研究员梁新兵、向劲宇领衔,于兆洋、洪思睿、张佳钇等MetaGPT核心贡献者联合开发

革命性突破

  • 思维链可视化

    • 实时展示任务分解逻辑树

    • 文件操作即时通知(如"report.pptx已生成于./output")

    • 错误日志关联修复建议(如"验证码失败→推荐使用代理IP池")

  • 动态上下文总线

    • 工具间数据共享效率提升40%(对比传统Agent)

    • 支持上下文缓存回溯,避免多轮对话信息丢失

现存挑战

  • 安全防护机制待完善 :PythonExecute工具需手动启用沙箱模式

  • 前端可视化缺失 :复杂任务调试依赖命令行日志分析



二、 CAMEL-AI/OWL:性能至上的开源标杆

核心宣言 : “0天复刻,性能天花板”

GitHub : camel-ai/owl

https://github.com/camel-ai/owl

技术硬实力升级

  • GAIA Benchmark 57.7% :超越HuggingFace Open Deep Research(55.15%),验证复杂任务处理能力

  • Ubuntu容器化架构

    • 秒级启动隔离环境,支持跨平台数据挂载(云存储/本地文件系统/数据库)

    • 自动生成 todo.md 规划文档(任务分解错误率降低28%)

  • 记忆增强系统

    • 短期记忆 :保留最近5轮对话上下文

    • 长期记忆 :通过向量数据库实现91%知识召回率

新增技术细节

  • 六步工作流复刻

  1. 启动Ubuntu容器(云端/本地双模式)

  2. 知识召回(关联历史任务经验库)

  3. 多源数据接入(支持S3/MySQL/Local FS)

  4. 数据动态挂载(自动识别CSV/PDF/HTML格式)

  5. 智能生成 todo.md (带优先级标记与时间预估)

  6. 调用Ubuntu工具链(终端命令/浏览器操作/部署流水线)

  • Ubuntu Toolkit扩展

    • 终端控制 :支持apt-get安装、服务部署、日志监控

    • 文件解析 :PDF转Markdown(保留表格结构)、网页结构化爬取

    • 浏览器自动化 :滚动/点击/输入链式操作(支持验证码识别中继)

    场景突破案例

    • 伦敦影讯查询

      • 自动筛选影院→比价→生成观影路线图(含交通时间预估)

    • GitHub仓库分析

      • 代码结构可视化(依赖关系图+贡献者活跃度热力图)

      • 智能识别潜在安全漏洞(基于CVE数据库匹配)

    技术护城河

    • CRAB技术融合

      • 继承自跨平台控制框架 CRAB (是该团队之前开源的一套强大的跨平台操作系统的通用智能体): CRAB不止能操控Ubuntu容器,还能直接控制手机和电脑里的任何应用,覆盖比Manus展示的终端和浏览器多得多。

      • 未来支持手机/PC应用直接操控(实验性接入ADB/Win32 API)

    • 企业级扩展性

      • 私有化部署方案(支持GPU集群分布式计算)

      • 审计日志与操作回滚功能

    开源 vs 闭源:参数级对比

    维度 Manus OWL
    代码权限 闭源(需签署NDA) 全量开源(Apache 2.0协议)
    部署成本 ¥3万+/年(基础版) 本地部署零成本
    工具扩展 固定工具链 支持自定义Python工具插件
    执行环境 云端沙箱 云端/本地/Docker三模切换
    数据主权 强制上传至厂商服务器 数据全程留存用户环境

    三、 OpenHands:49K星的全栈野心家

    核心定位 : "让AI代理成为全栈开发者"

    GitHub : All-Hands-AI/OpenHands
    https://github.com/All-Hands-AI/OpenHands

    技术架构:安全与效率的平衡术

    系统设计亮点

    • Docker沙箱运行时

      • 基于定制化镜像( docker.all-hands.dev/openhands:0.27 )构建隔离环境

      • 支持资源配额控制(CPU/内存限制)、操作审计日志、环境快照回滚

    • 三层镜像构建体系

      • 版本标签(Versioned Tag) :基础功能镜像(如 oh_v0.9.3_nikolaik

      • 锁定标签(Lock Tag) :依赖固化镜像(哈希值标识)

      • 源码标签(Source Tag) :实时代码同步镜像(开发调试专用)

    • 插件化扩展

      • 内置Jupyter内核、浏览器控制、API网关等模块

      • 开发者可自定义插件

    架构示意图


    backend_architecture.svg
    OpenHands系统架构图

    OpenHands Runtime流程图


    开发者实战:从Hello World到企业级流水线

    典型应用场景

    1. 基础脚本开发


      # 生成带参数处理的Bash脚本  
      docker exec openhands-app agent run "编写hello.sh脚本,接收姓名参数并默认输出'Hello World'"

      输出结果


      #!/bin/bash  
      NAME=${1:-"World"}
      echo "Hello $NAME"
    2. 全栈应用构建


      # 创建React TODO应用并集成GitHub Actions  






    请到「今天看啥」查看全文