专栏名称: 人工智能学家
致力成为权威的人工智能科技媒体和前沿科技研究机构
目录
相关文章推荐
AI范儿  ·  DeepSeek 日活破 2570 ... ·  昨天  
AI范儿  ·  DeepSeek 日活破 2570 ... ·  昨天  
爱可可-爱生活  ·  晚安~ #晚安# -20250206224457 ·  昨天  
机器学习研究组订阅  ·  16张H100训26分钟,超越o1-prev ... ·  昨天  
机器之心  ·  自有歪果仁为DeepSeek「辩经」:揭穿围 ... ·  3 天前  
爱可可-爱生活  ·  【单Agent vs. ... ·  3 天前  
51好读  ›  专栏  ›  人工智能学家

诺奖得主DeepMind CEO最新万字访谈:视AI为普通技术错误,AGI还差2 到 3 项重大创新

人工智能学家  · 公众号  · AI  · 2024-10-20 17:26

主要观点总结

DeepMind CEO Demis Hassabis关于人工智能的访谈,他谈到了人工智能的发展、AGI的进展和未来挑战,以及DeepMind的目标和计划。他强调了人工智能对经济和社会的影响,并表示需要更多的研究和投资来确保人工智能的发展可控和安全。

关键观点总结

关键观点1: Demis Hassabis对于人工智能发展的看法

他认为人工智能将会改变经济和社会,消除能源和资源的稀缺性,让人类进入一个物质极大丰富的时代。但也需要提前思考如何分配这些财富,例如是否应该实行全民基本收入制度。

关键观点2: 关于AGI的进展和所需技术

Hassabis表示,距离实现AGI还有大约10年的时间。他认为多模态模型是AGI系统的关键部分,但现在还需要两到三个重大创新才能完全实现AGI。他还强调了基于代理的系统的重要性,这是实现AGI的重要一步。

关键观点3: 关于人工智能的风险和挑战

Hassabis表示,人工智能系统存在风险,需要进行更多的研究和控制。他强调了定义目标和价值观的重要性,以及确保人工智能系统坚持这些目标和价值观的必要性。他签署公开信的目的是提醒人们注意这些风险,并倡导建立更多机构来研究和测试最新的模型。

关键观点4: 关于英国在人工智能领域的发展

Hassabis认为英国政府应该鼓励在人工智能领域的投资和建设,包括建立数据中心。他认为这是一个巨大的机遇,可以建立一个新的生态系统,基于人工智能或与人工智能相邻的初创公司。


正文


谷歌DeepMind CEO Demis Hassabis说,将人工智能视为普通技术是错误的,人工智能将具有“划时代的意义”,很快将治愈所有疾病、解决气候和能源问题并丰富我们的生活,AGI大概需要 10 年时间,因为还需要 2 到 3 项重大创新,下一项就是基于代理的系统

来源:图灵人工智能

谷歌DeepMind CEO Demis Hassabis 最近在《泰晤士报》和《泰晤士报商业版》的主办的科技峰会上发表演讲,Hassabis回顾了DeepMind的创立,谈了 AGI、AlphaFold 和 AI 的未来


照例先给大家划个重点(访谈全文附在文后):

Demis Hassabis看见了什么? Hassabis已经在游戏的微观世界中看到了一点,并且理解得很清楚:从一个随机的系统AlphaZero开始8小时就可以训练出超越最顶尖人类的国际象棋实体,虽然这只是游戏狭窄领域,但一定会扩展出世界模型

DeepMind 的初心: Hassabis 30 年前就开始研究 AI 了!从游戏 AI 到神经科学,他一直坚信 AI 的潜力。2010 年,他创立 DeepMind,因为他看到了深度学习和强化学习的巨大潜力,以及 GPU 等硬件的快速发展。他想打造一个通用的、能自我学习的 AI 系统,这正是 DeepMind 的初心!

游戏 AI,AGI 的“练兵场”: DeepMind 早期专注于游戏 AI,是因为游戏可以快速验证算法的有效性,而且容易进行基准测试。但他们的目标不仅仅是赢得游戏,而是开发通用的 AI 技术,并将其应用于其他领域,例如科学和商业

AlphaFold:AI for Science 的典范: Hassabis 一直对用 AI 解决科学难题充满热情,而蛋白质折叠问题是他最想攻克的目标之一。AlphaFold 的成功(Hassabis因AlphaFold 获得2024诺贝尔化学奖),证明了AI 在科学领域的巨大潜力!

多模态模型,AGI 的关键: Hassabis 认为,多模态模型是 AGI 系统的关键组成部分,例如 DeepMind 的 Gemini 模型,它可以处理文本、图像、音频、视频和代码等多种输入

通往 AGI 的道路:更强大的 Agent: 现在的聊天机器人大多是被动的问答系统,而未来的 AI 系统需要更主动、更智能,能够像 AlphaGo 一样进行规划和推理,并在现实世界中采取行动

AGI 时代,还有多远? Hassabis 预计,我们距离 AGI 还有大约 10 年的时间

DeepMind 的未来: DeepMind 将继续以研究为导向,同时也会加大产品研发的投入,与谷歌的其他部门合作,将 AI 技术应用于更多产品和服务中

AGI 时代,人类将进入富足时代! Hassabis 认为,AGI 将彻底改变经济和社会,消除能源和资源的稀缺性,让人类进入一个物质极大丰富的时代。我们需要提前思考如何分配这些财富,例如,是否应该实行全民基本收入制度

访谈全文:强烈推荐

注意:这是Demis Hassabis10月1日的访谈,此时距离10月9日他获得2024年诺贝尔化学奖还有几天时间,但是访谈视频今天才放出来


主持人: 我想,在座的各位几乎都知道DeepMind,也知道它现在在做什么。让我们先简单回顾一下您的故事,因为您在2010年左右创立了DeepMind,而在此之前,人工智能经历了40年的寒冬,作为一名科学记者,我当时并没有关注人工智能。DeepMind为何在那个时候出现?是有什么有利因素吗?

Demis Hassabis: 嗯,我研究人工智能实际上已经超过30年了,最初是做游戏,为游戏设计人工智能,以及模拟游戏。后来我学习了计算机科学和神经科学,并且一直在观察人工智能领域的发展。在您提到的90年代的人工智能寒冬时期,都是逻辑系统,也就是所谓的专家系统。你们很多人可能还记得深蓝在国际象棋比赛中击败了加里·卡斯帕罗夫(俄罗斯国际象棋棋手,国际象棋特级大师,前国际象棋世界冠军),这些都是预编程系统,实际上是程序员和系统设计者解决了问题,并将其封装成规则。计算机、人工智能系统实际上根本不智能,它只是在执行这些启发式方法。这样做的问题是,最终会得到脆弱的系统,它们无法学习新东西,当然也无法发现新东西,因为它们显然天生就受到设计者或程序员已知能力的限制。

所以对我来说,很明显,在整个90年代,我在剑桥和麻省理工学院学习期间,这仍然是主流观点,尤其是在那些地方,逻辑系统才是正道。我认为这就是出现很多人工智能寒冬的原因,因为它们天生就脆弱且局限。所以在2010年,DeepMind的想法是,我们可以看到深度学习刚刚在学术界被发明出来

强化学习是我们发现的东西,大脑中的多巴胺系统,动物和包括人类在内都使用强化学习来学习

因此,对我来说,显而易见的是,我们需要构建的是一个能够自学且通用的学习系统,这就是DeepMind的起源。然后我们也看到了GPU和硬件加速等技术的进步。所以我使用了第一代GPU,它是用于计算机图形、计算机游戏的,但它们是非常通用的,事实证明,世界上的一切都是矩阵乘法。我们很早就开始了,我们觉得这就像一个阿波罗计划,需要付出巨大的努力才能将所有这些新奇的想法和成分整合在一起可以取得非常快的进展,结果也确实如此

主持人: 这是您在普林斯顿时期预想的结果吗?您是否想过15年后,我会在这里与您对话,人工智能会成为热门话题,并且蛋白质折叠问题会被解决?

Demis Hassabis: 实际上,它大致沿着我们计划的路线发展,当然,过程中也有一些小插曲和意想不到的事情,但当我们在2010年开始时,我们认为要达到通用人工智能大约需要20年的时间。我认为我们可能距离这个目标还有10年左右的时间。从现在开始,大致是那个时间线,用人工智能系统进行科学研究,在通往人工智能的道路上解决科学问题一直是我的主要热情所在。 蛋白质折叠一直是我最想解决的科学难题之一,如果我们能够取得突破,它将带来变革

主持人: 好的,让我们回到这一点,我认为我们也应该谈谈人工智能,因为有趣的是,自从ChatGPT出现以来,我们作为一个社会一直在非常深入地讨论人工智能,它与您一直在做的人工智能是截然不同的,作为一名观察者,您的人工智能一直都非常具体,观察它有点奇怪,你知道,它开始做一些毫无意义的事情。它非常擅长电脑游戏

Demis Hassabis: 我不会说它们毫无意义,但它们更多的是为了好玩,也许你可以这么说。我们从游戏入手,部分原因是我的游戏背景以及认真下棋等等。但我可以看到,游戏与人工智能一直有着悠久的历史。从图灵和香农在人工智能领域的早期开始,所有这些伟大的,他们都是从象棋程序开始的。几乎每个AI先驱都这样做过。而且,它一直是我们的试验场。你能用你的算法思想快速取得进展吗?然后很容易衡量你的水平,如果你能击败世界冠军或最好的计算机,那么你就知道你做得很好。但关键是,它们始终是达到目的的手段,而不是目的本身。所以我们的想法是:

不要仅仅为了击败围棋或国际象棋的冠军,而是要以一种能够推广到其他领域的方式来做到这一点,包括科学和商业应用。这就是我们用深度强化学习和AlphaGo所做的,所有这些都是非常通用的系统,我们至今仍在使用

现在,当你谈到像AlphaFold或我们的科学程序,它们解决了蛋白质折叠等问题时,你真正感兴趣的是解决方案本身。如果你找到了治疗癌症的方法,你不会在乎它是如何做到的。你只想要治疗癌症的方法。所以你真的想全力以赴。 所以你首先要做的就是把你所有的通用技术作为基线。然后你再看领域本身,如果这个领域对社会或商业足够有价值,那么你就在上面添加定制的东西。这就是你如何得到像AlphaFold这样的突破性程序。 但最终,DeepMind的目标,从我们创立之初到现在,仍然是实现通用人工智能,这意味着一个通用的系统,它能够开箱即用地完成任何你能完成的认知任务。完全通用,就像阿兰·图灵在50年代所定义的那样,能够计算任何可计算的东西。这是人工智能作为一个领域的最初目标,也是DeepMind的目标

当然,你最近看到的是像这些语言模型之类的东西。实际上是ChatGPT进入了大众市场,进入了公众的视野。但实际上,所有顶级实验室,包括谷歌和DeepMind,都在研究语言模型。我们有自己的内部模型,叫做Chinchilla,谷歌也有他们的模型。当然,它们都是基于Transformer架构的,这是谷歌研究院发明的,所有当前的模型都是基于它的。所以这是一个激动人心的时刻,因为语言显然是一种通用能力。这就是为什么每个人都对聊天机器人感到非常兴奋的原因。而且非常有趣,而且有点出乎意料的是,这项技术能够扩展到如此程度。我认为我们比以往任何时候都更接近构建这些类型的通用系统。但目前你仍然需要专门的系统来在特定领域做到最高水平

主持人: 大型语言模型更接近AGI吗?我的意思是,它感觉更像是在与人互动,而这感觉就像AGI。但它真的是吗?

Demis Hassabis: 我认为,多模态,现在甚至不应该说是大型语言模型,因为它们不仅仅是大型语言模型。它们也是多模态的。例如,我们的Gemini模型从一开始就是多模态的。它们可以处理任何输入。视觉、音频、视频、代码,所有这些东西,以及文本。所以我认为我的观点是,这将成为AGI系统的一个关键组成部分,但可能仅凭它本身还不够

我认为从现在到我们实现AGI,还需要两到三个重大创新。这就是为什么我给出的时间表是超过10年的原因。其他人,我的一些同事和同行,以及我们的一些竞争对手,他们的时间表比这要短得多。但我认为10年左右是比较合适的

主持人: 这与DeepMind内部的,我猜是内部的紧张关系是如何协调的呢?因为我感觉,尤其是在早期,你们就像世界上资金最雄厚的大学实验室之一。就像贝尔实验室之类,一个伟大的商业研究机构。但现在你们正在做一些非常有用的事情,你们有一系列的,我的意思是,你提到了蛋白质折叠,但你们还有天气预报。你们刚刚在国际数学奥林匹克竞赛中获得了一枚奖牌。对不起,我相信如果你自己去参加的话,你也能获得金牌,但你们的系统获得了一枚银牌。你们正在做所有这些其他的事情。你们在背后也在做吗?你们有团队在思考吗?但是现在我们需要继续前进,制造AGI?

Demis Hassabis: 是的,我们有一个很大的组织。正如你所说,我们最初的DeepMind模式有点像贝尔实验室,它是世界上最好的工业实验室之一,能够发明未来,能够长远思考。我们真正展示了这种模式能够做什么。我认为它在为我们今天看到的各种技术奠定基础方面非常有效。所以我认为任何类型的深度技术初创公司都需要时间来发展其成熟的技术

在过去的两三年里,我们已经到了一个非常激动人心的时刻,这项技术已经相当成熟。它已经准备好应用于各种领域。很明显,有科学、数学、医学,以及所有这些领域的进步。可以算是应用科学。如果你愿意,但也有生产力和商业应用,比如聊天机器人或重新构想工作流程和电子邮件等等,这还处于萌芽阶段,以及帮助编码等等。我们显然也致力于所有这些工作,我们是谷歌的引擎。谷歌拥有令人难以置信的,我想是150亿用户,以及平台和产品,而人工智能是所有这些的核心,新的功能不断涌现,来自我们DeepMind开发的一些技术

这在某种程度上是很好的,因为产品所需的技术类型实际上与你无论如何都会进行的AGI研究类型有90%的相似之处。这些东西已经有很多融合了,而在五年前或十年前,如果你想将人工智能融入产品中,你必须这样做,因为通用系统和学习系统还不够好,你必须回到逻辑网络,专家系统。像早期那一代的助手,例如,都仍然建立在那种旧的技术之上,这就是为什么它们很脆弱,它们不能泛化,最终它们也没那么有用,而建立在这些学习系统上的新一代助手将更加强大。而且,实际上,非常令人兴奋,我实际上认为像Gemini以及我们自己对未来多模式助手的设想,目前称为Astra,它们是通往AGI系统的关键路径,因为它们实际上推动了朝着这个方向的研究。所以,这里有一段Astra工作的视频

以下视频来源于

谷歌黑板报

Demis Hassabis: 这只是一个能够在日常生活中帮助你的通用助手的开始。我听到要把它做成员工。也会有不同的形式。你可以在手机上看到它,你可以在眼镜上看到它。我无法形容这会有多么神奇。如果我们回到五年前,你告诉我我们会走到今天这一步,你只需用相机指向某个东西,它就能完全理解空间环境。这真是太不可思议了。就好像它有概念,它理解什么是物体,甚至能认出我们所在的街区。仅仅是通过窗户看到的周围景色。像记住你把东西放在哪里的记忆,这可能非常有用,就像一个助手一样。个性化和所有这些东西都在这个我称之为下一代助手的产品中出现。我称之为通用助手,因为我想象你把它随身携带在不同的设备上。它是同一个助手,无论它是和你玩游戏,还是在你的桌面上帮助你工作,或者是在移动设备上陪你旅行

主持人: 是这样吗?我认为我理解对了。有些人会认为这是通往通用智能的一步。如果没有我们还没有的秘密武器,那么它本质上就是这个目标。它与我们目前使用的方法之间没有无法弥合的差距。它只是你达到了70%,你达到了80%,你达到了90%吗?还是有什么其他的东西需要解决?

Demis Hassabis: 嗯,我们肯定需要这些系统,我相信你们所有人都已经体验过各种最先进的聊天机器人了。 这些系统非常被动,它们是问答系统。 它们对于回答问题,也许做一些研究,总结一些文本之类的事情很有用。

我们接下来想要的是更多 基于代理的系统 ,能够完成你给它的特定目标或任务。这当然是我使用助手,数字助手需要做的。你计划一个假期,你在城市里旅行,你告诉它帮你订票。所以它们需要能够在世界上行动,执行动作并进行规划。所以我们需要 规划、推理、行动,我们需要更好的记忆,我们需要个性化 ,所以它需要了解你的喜好,记住你告诉它的内容和你喜欢的东西。所以所有这些技术都是需要的

现在,我给出的简略说法是:

我们的一些游戏程序,比如击败了围棋世界冠军的AlphaGo,它有规划和推理能力,尽管是在这个狭窄的游戏领域。我们必须引入这些技术,并将它们应用于像Gemini这样的多模态模型,它们基本上是世界模型,正如你刚才看到的,它理解它周围的世界。 但是如何在杂乱的现实世界中进行规划,而不是像游戏这样的干净的环境呢?所以我认为这是下一个需要取得的重大突破

主持人: 那这个系统也能应用AlphaGo级别的游戏和拉动某种方法吗?

Demis Hassabis: 是的,没错。有两种方式可以实现,这是我们内部以及学术界目前正在进行的非常有趣的辩论。你可以想象,你希望你的通用代理系统能够做的一件重要的事情就是 使用工具 。这些工具可以是硬件,比如机器人或物理世界中的东西,但它们当然也可以是其他软件,比如计算器,诸如此类。但它们也可以是其他人工智能系统。所以你可以拥有,你可以想象一个像大脑一样的通用人工智能系统,然后调用像AlphaFold或AlphaGo这样的东西来下围棋或折叠蛋白质,或者因为它是全数字化的,你可以想象将这种能力折叠到通用大脑中,折叠到Gemini中。但这需要权衡取舍,因为这样你是否会用专门的信息超载它,比如太多的棋局,然后这会让它在语言方面变得更差

这是一个开放的研究问题,你是想把它分离成一个工具,即使是一个通用人工智能可以在特定情况下使用的AI工具,还是你想把它上游到主系统中。有些东西你想上游到主系统中,比如编码和数学,因为事实证明,如果你把它放在主系统中,它实际上会让一切变得更好。所以有点像你在学习理论和儿童发展理论等等,实际上是为了思考哪些东西可能是通用的,并且最好放在主系统中而不是外围工具中

主持人: 你现在组织还有多少比例是一个科学组织?你还有多少比例在努力成为贝尔实验室?

Demis Hassabis: 我们永远都会是一个以研究为主导的组织。这就是我们现在在Google DeepMind所做的。但我们越来越多地拥有一个越来越大的产品应用团队,与谷歌的其他部门进行互动。但我们仍然试图让我们的基础研究稍微不受其影响,这样它就可以根据我们自己的研究路线图进行更长远的、更具蓝天意义的思考,而不仅仅是由产品路线图所主导

主持人: 您个人是如何跟上这一切的呢?

Demis Hassabis: 嗯,我努力,我的意思是,我曾经在18个月前说过,我会保留我的晚上时间,而且我是一个很自律的人。所以我把午夜到凌晨3点的时间留给思考、阅读论文和提出想法,我仍然在伦敦。但现在我在加州有很多团队。所以很多黄金思考时间都被与美国的电话会议占据了。想想如何腾出这些时间

主持人: 我们可以把计时器放在这里吗,如果可以的话。否则,我们会让你错过你的饮料,而且我不确定我们还有多少时间。未来会怎样?我认为你是其中的一员,你是签署了其中一封公开信的人之一,警告说,你知道,真正的生存风险,但这并没有特别明确的定义。你对 希望、炒作和末日持什么立场?

Demis Hassabis:







请到「今天看啥」查看全文