专栏名称: 人工智能学家
致力成为权威的人工智能科技媒体和前沿科技研究机构
目录
相关文章推荐
爱可可-爱生活  ·  【[37星]Ola:打破多模态边界,实现图像 ... ·  昨天  
爱可可-爱生活  ·  【[50星]mdy_triton:一键加速H ... ·  昨天  
爱可可-爱生活  ·  【[52星]N8loom:基于树结构的前缀缓 ... ·  2 天前  
51好读  ›  专栏  ›  人工智能学家

王小川的三阶段论:从物理、语言到意识的数学化

人工智能学家  · 公众号  · AI  · 2024-09-29 20:23

正文

来源: 元界

整理编辑:抱一君

牛顿是科学时代起步时的一位科学家,他的重要工作是把物理学变成了数学。智能时代的起步,是从把语言变成数学开始的,以ChatGPT的突破为标志。

两者都是非常重大的时代突破。而在这里面,多模态并没有那么重要。

从科学时代、智能时代再往下走,迎来的将是共生时代,就是把生命变成数学问题,把意识变成数学问题,这个可能发生在十到二十年之后。

9月28日,2024清华五道口首席经济学家论坛在北京举行。百川智能创始人兼首席执行官王小川在主题演讲,分享了他的科学时代、智能时代迈向共生时代的三个时代论。

他首先分享了他的被证实是对的三个有关技术发展路径的认知:尽管多模态技术备受关注,但真正的突破在于语言处理技术。当行业普遍追求更大模型时,他认为真正的机会在范式的转变,GPT-o1的发布就是这种体现。在场景应用上,医疗健康是大模型应用的“皇冠上的明珠”,最后通向AGI。

他认为堆砌数据的大模型是“学而不思则罔”,学的东西很多,但是脑子是混乱的。拿它跟真实世界对齐,这个系统有它的天花板。走向慢思考背后的一套语言体系就是强化学习,强化学习的做法正好跟大模型截然相反,如果只是思考而没有学习,就是“思而不学则殆”。

OpenAI Sam Altman:我们真的相信深度学习,这是我们的赌注

而无论美团、滴滴、抖音和搜索,改变的都是生产关系。大模型实现范式的改变,直接产出生产力。

他认为,大模型时代,发现需求不是重点。很多需求已经天然存在,更多是供给不足,生产力不足。之前更多在造工具,有了大模型之后,实现的是造人,造自己的员工,造我们的伙伴,使得人类推向新的世界,人与智能形成共同面向世界的文明。

以下为王小川演讲的删减精要版:

我发现这一年多来技术路径怎么发展、市场怎么发展,我讲的都是对的:

第一,我反复强调语言为中心,这是最重要的一件事,语言变成数学是这一代的变化。行业老提多模态,整个学术界把多模态当回事儿,但其实突破是在语言上。

第二,行业开始往做的足够大的方向不断发展,但是有一个大的机会是范式的变化,GPT-o1的发布,从快思考走向慢思考,改变了堆积参数的方向。

第三,在赋能千行百业的场景中,往下要验证的就是医疗健康。医疗式大模型是皇冠上的明珠,最后走向AGI。

今天我的题目《从科学时代迈向智能时代》,开得有点大,先谈几个观点。在去年年初的时候,就通用智能时代是不是到来了,有争论。我是坚定地相信它到来了。我在2018年的时候讲过一句话,“当机器掌握语言,强人工智能就到来。”那会儿还没有到来。当我开始用GPT,开始看到机器掌握语言之后,我知道变天了,我们开始进入智能时代。

从工业时代、电气时代、信息时代到智能时代,我们称后者为第四次工业革命,这似乎是大家形成的共识。我依然觉得智能时代要比大家想的还更大。我不是把它当工业革命去看,这样看还有一种惯性。

我认为当下是科学时代向智能时代的迈进。牛顿是科学时代起步时的一个科学家,他有一本巨著叫做《自然哲学的数学原理》,在此之前有一本书叫《自然哲学》。 牛顿重要的工作是把物理学变成了数学, 科学实验范式也是他提出来的。从康德的讲法来讲,数学是理性的空间,我们没法得到真实的世界,但是物理学是今天最接近真实的学科。

天上星星怎样运动的,苹果怎么落地的,以前是不同的自然现象,但是通过他的翻译体系就变成了数学公式,变成了模型,变成了统一的一件事情了,世界的物理万物变成数学解释现实世界。像相对论、量子力学、麦克韦斯方程等等,都是以物理学变成数学作为起点,因此叫做科学的时代。

今天智能时代,跟科学时代不一样了!

首先,科学时代更多讲我们对世界的观测, 智能时代的起步,是从把语言变成数学开始的。 语言是人类认知世界中间重要的一个工具。其实人是观测者,没有观测者就没有创造者,观测使得我们对世界重新以人的意义体系建模。

维特根斯坦讲,语言的边界就是你世界的边界,包括语言是符号体系,数学、代码都是语言的符号。学过高等数学的知道,一个等号是一件非常复杂的事情,1+1=2,什么叫等号呢?这个等号是等价群的意思。人类发明语言是一种重要的重新分类的活动,代表的就是智能。

语言是我们学习知识、思考和沟通的载体,当语言变成数学问题之后,我们的沟通、知识和思考就变成了数学问题。 像物理变成数学一样,这是非常重大的时代突破。多模态在这里面,但是没有那么重要。

第二件事情是从快思考到慢思考。今天大模型拍脑袋灵光一现给人一点输出,不是经过深思熟虑的。用强化学习和思维链解决慢思考的问题,就发生在两周前重大的事件,这一大模型国内偏冷,但其实又有人类智慧巨大的突破。

前两天有媒体让我再预测下一个突破是什么?我想 在五年、十年后重要的一件事情是,机器能够通过写代码去运行代码,获得解决问题的能力。

譬如机器可以生成代码,生成一个下围棋的code去运行它,运行完之后机器学会下围棋,可以想象通过语言背后能够产生代码的连接。这个东西挺科幻,但我认为是大的技术方向。

再往下还有一个时代,那就是怎么 把生命变成数学模型 。后面我们再理解生命, 理解活着本身背后的数学问题,理解意识背后的数学问题, 人跟机器在共生当中都是以生命的视角来看,而不是物理的世界模型。 我称之为共生时代,这是我做的一个预测,可能发生在十到二十年之后。

英伟达黄仁勋已经讲过,今天出生的人不要再学习写代码了,写代码的工作未来机器都会干,我们要学习生物、生命、生物医药学。从科学时代、智能时代再往下走,我认为是走向共生时代。

智能时代核心在做四个阶段性工作,前两个在信息时代开始解决,我沿用DIKW的模型,它们分别指Data、Information、 knowledge、Wisdom。 二十年以前人类最伟大的作品,开篇之作是搜索,是解决信息检索的问题,数据变成了信息。收官之作的代表是抖音和TikTok,信息从搜索走向推荐。

再往后一直没解决的问题是知识问题,大家都听过一个词叫知识图谱,这是谷歌发明的一个词knowledge graph,我用一个概念讲叫做“苦海无崖,回头是岸”。这样的技术路线图是不通向未来的,靠人在里面大量地解三元组,人这样教机器学会语言,本身是不可能实现的事情,但大模型一举攻破了这个问题,把知识变成了数学问题。

之后开始走向搜索增强,把信息用起来,这个事情发生了18个月,GPT-o1的发布代表了强化学习的开始,我们跳出原来已经有的知识学习的分布。

从生成式大模型到推理大模型是重大的变化。语言模型的特点是数据越多越智能,除算力以外,尽可能多的数据进来,学的越多,它变得越聪明。这个学习系统,按照中国的古话来讲叫做“学而不思则罔”。学东西很多,但是脑子是混乱的,并不经过自己的反思。拿它跟真实世界对齐,这个系统有它的天花板。

院士鄂维南:当前人工智能技术路线不可持续,中国研究者要跳出主流框架
院士鄂维南:堆砌大模型不适合中国,“别人做了,就不再去凑热闹”

郭毅可:AI是年轻人的天下,跟风去卷不过是在别人体系里挣扎

走向慢思考背后的一套语言体系就是强化学习,经典的代表之作是2016年发布的AlphaGo。强化学习的做法正好跟大模型截然相反,强化学习让数据越少越好,专家越少越好,每丢掉一些专家就变得越聪明,后来就是Alphazero,与AlphaGo动用了人类6000万的起居做了训练相比,Alpha zero用的是0,它不靠人教它怎么下棋,通过规则、通过思考,它自己学会了下棋,反而得到比人更高的下棋的能力。 如果它没有学习,只是靠思考,按照中国论语讲的就是“思而不学则殆”。







请到「今天看啥」查看全文