本文由作者参加九派新闻直播九派圆桌《
manus爆火,套壳还是创新
》讨论时的发言整理而成
Manus离通用人工智能体差距较远
Manus爆火有多方面因素。
首先,Manus的核心技术在于多智能体系统的协同,它能够动态协调专用大模型,把这些大模型进行统筹调用,最后组织起来。另外,它的用户体验现在看来还不错,在界面和交互设计上的工作做得也较好。
现在,大家都希望大模型能落地,Manus应市场需求做了一些相应的能量释放,比如在人力资源、金融等领域。
当然,Manus也有炒作成分,目前邀请码也是是“一码难求”。如果它的技术能够经得起检验,未来可能走得更远,如果还处在比较初级的阶段,大家也是一时热闹。
事实上,“通用智能体”的概念是大家的一个梦想。我们一直认为以现在的数学和物理学想做到“通用”是特别难的。
因为通用有三个特点:首先是主动性。通用的自主性很强,像人一样,它会有“want”,即知道我想干什么,我想用什么;第二,它的基本的功能是能干很多事,既能炒股,也能筛选简历,还能够围棋等等。最后,一个智能体要有价值观。现在的智能体没有价值观,它的事实和价值不对齐,常会出现所谓的“机器幻觉”、“机器错误”以及“机器欺骗”等东西。它还是被动的token,吃了很多人为的NLP、自然语言里面的一些符号,再相应用
tranformer
架构处理,吐出相应的输出,这些输出有好有坏。
所以,我们说Manus是通过“规划-执行-验证”这三个独立代理的分工协作实现了任务的分解,工具的调用和动态的修正就是修正全流程的自动化,在简历筛选的过程中,它能够自压缩文件、分析内容生成排名报告,全程无需人参与。
但是,它只有自动化过程是确定的。
Manus的不确定性还体现在它调用的例如deepseek、 claude 这些大模型存在的不确定性。它本身是要按照确定的流程来进行分工拆解的,所以真正的智能里一定有不确定性,而自动化里却包含了确定的流程、确定输入、确定处理、确定的输出、确定反馈,我们叫做自动化过程。
Manus里有很多自动化的成分,但不确定性的成分相对来说比较少。所以我们说Manus离通用人工智能体还差距还比较远。
在AI领域,“套壳”和“蒸馏”每天都在进行
Manus光靠卖邀请码是肯定不能回本的。
另外,我个人认为它是一个集成的系统,底层是用别人的东西,门槛相对较低。像 deepseek的门槛就相对高,因为它涉及到算法的优化,还有一些工程困难。
Manus存在很多不确定性和一些没有解决的技术或原理性的问题,比如数据的不完备性、数据的偏差和数据的造假,数据问题它很难摆平。第二个就是算法问题。无论是deepseek、claude,还是Chat GTP也好,他们都是基于transformer架构
Transform架构本身就是多内存的神经网络系统,这个系统里有两个基本函数,一个是线性函数,一个是激活函数。这两个函数在一起,就会产生一个非线性的复合函数,造成在反向传播过程中,它的权重分配的不可解释性黑盒。它们在基因里面就带着“机器可能会产生错误”,也叫“机器幻觉”。
另外,这个架构在使用过程中有很多噪声干扰,很难屏蔽,在实际工程落地的过程中,它会有各种各样的偏差和误差积累,会造成应用的落地困难。
我觉得Manus是一个集成的开拓者,但它要想在这个领域里面保持领先,难度还是比较大的。
春节期间,很多人说Open AI要告deepseek“蒸馏”的问题。其实,“套壳”和“蒸馏”每天都在进行。学生在“蒸馏”老师,我在“蒸馏”朋友,这也很正常,因为没有前人就没有后人。在大模型领域,或者说AI领域里,这属于比较正常的两个词。
但是,现在的智能体,无论是单智能体还是多智能体,和大模型不太一样。Open AI的奥尔特
曼
说过一句话,大模型有五个发展阶段,第一个是交互,问他问题,它能回答。第二个是推理,deepseek
r
1就是一个推理模型,其实GPT 4也是。第三个阶段是调用,我感觉Manus更多的是调用。第四个是创新。第五个涉及到组织。
目前,大多数的实践还停留在较浅的层次,因为深层的多智能体模型之间的协同工作极为困难。我认为,目前能够达到让人为之一振的产品和系统已经相当不易
。
然而,我们也需要冷静地看待,因为正如之前所说,Manus的门槛相对较低,并不像DeepSeek或OpenAI最初出现时那样耀眼夺目。但是,我们既要保护它,又要清醒地认识到其不足之处,继续前进,做得更好。
机器想取代人,很困难