专栏名称: GGV纪源资本
不止是VC。
相关文章推荐
新疆949交通广播  ·  38人深夜飙车!新疆交警一举查获 ·  8 小时前  
算法与数据结构  ·  2024图灵奖颁给了强化学习之父Richar ... ·  2 天前  
九章算法  ·  Intel面临破产危机!裁员50%断尾求生! ·  昨天  
九章算法  ·  「九点热评」亚麻裁去14000名mgr! ·  昨天  
新疆是个好地方  ·  定了!乌鲁木齐天山国际机场 ·  3 天前  
51好读  ›  专栏  ›  GGV纪源资本

狂热过后,我们和几位硬件工程师聊了聊Manus的真正价值|亮马桥小纪严选

GGV纪源资本  · 公众号  ·  · 2025-03-11 10:30

正文

图片




小纪有话说:


在昨天拿到 Manus AI 的测试码、连续进行了数个小时的测试之后,有不少在手机/PC 厂商的工程师/产品经理朋友,来找我「打听」Manus AI 的真正能力如何。


为什么硬件行业这么关注 Manus?这与当下硬件行业最受关注的概念——LAM 有关。LAM 是一个从 LLM 延伸而来的名词,全名为大型行动模型 (Large Action Models),也称为大型智能体模型。


与 LLM 致力于「超越人类」,因此在训练方法上也经常突破人类经验完全不同,现阶段 LAM 想要做到的,是成为人类的手,去作为人类用户在数字世界中的代理人。


这与 Manus 的核心理念有相通之处。目前而言,Manus AI 的体验,围绕在一个运行在云端的 Ubuntu 操作系统虚拟机上,同时在操作系统中打开 Chrome 浏览器界面,在网页中或是调用其他软件,来完成各种用户的请求。


为了完成这个要求,Manus 需求同时具备「自然语义理解和计算机视觉」,以及「用户行为习惯学习与场景感知」,同时拥有「意图识别自主决策」的能力,当然最重要的,同时也是让 Manus AI 与此前的 Computer Use 在体验上拉开明显差距的,还是「跨应用调用工具」的能力。


举例来讲,对于常见的「能不能用 Manus AI 生成一段视频」这个问题,严格来讲回答是「可以」,但 Manus AI 去生成一段视频的方式,也是通过在网络上搜索第三方 AI 视频生成工具,并在这个过程中使用到各种工具,来完成用户的请求。

本文经授权转载自公众号「极客公园」(ID:geekpark)
作者|张勇毅 编辑| 郑玄

LAM 真正的未来

进入 2025 年,Agent AI,或者说 LAM 在端侧的落地,已经是再明显不过的趋势。但怎么落地,以及最终呈现给用户的会是怎样的商业产品,仍然有很多问题。
早在 2024 年初,彼时发布的 Rabbit R1 硬件,以及对应的 LAM 工具——Rabbit LAM Playground 其实已经展现出了今天我们在 Manus AI 中看到的能力雏形。
在官方的演示中,Rabbit R1 所搭载的 LAM Playground,能主动帮助用户完成类似音乐播放、打车等服务,实际上背后的技术原理,就是通过使用 LAM 来访问对应服务的网站,通过模拟人类与网站的交互方式,完成用户指令中的工作内容。
Rabbit 发布的 LAM Playground,其实已经具备今天 Manus AI 的初步能力 | 图片来源:Rabbit
但彼时的 Rabbit Playground 受限于模型以及开发能力的限制,还并不能做到像人类一样,在互联网中畅通无阻。
在实际用户的测试中,面对类似人机验证这样的场景,Rabbit Playground 仍然难以通过,也无法使用第三方工具,来完成生成复杂表格、导出 PPT 这样的用户需求。






请到「今天看啥」查看全文