2024年9月13日,著名计算机科学家、斯坦福大学教授李飞飞的创业项目World Labs,首次官方披露详细信息。
World Labs 2024年1月成立,共有4名联合创始人,分别是李飞飞,李飞飞学生、AI专家Justin Johnson,AI专家Christoph
Lassner、Ben Mildenhall,李飞飞任CEO。
World Labs宣布完成2.3亿美元融资,投资方包括a16z、英伟达等机构,深度学习三巨头之一杰弗里·辛顿、谷歌DeepMind首席科学家杰夫·迪恩等AI领域知名人士。媒体报道,World Labs估值超过10亿美元。
World Labs研究方向,主要是空间智能,计划2025年推出首款产品,第一阶段将从世界模型开始,支持AR、机器人、自动驾驶等领域。
World Labs官宣后,李飞飞与另一位联合创始人 Justin Johnson,接受a16z专访,讨论AI发展历史、现状、未来方向等,涵盖AI技术各层面,特别是生成式AI与空间智能未来潜力。
李飞飞近期参加美国计算机历史博物馆CHM(Computer History Museum)举办论坛,深入探讨AI发展历史与未来趋势等,包括AI技术演进过程、ImageNet项目对深度学习推动作用、GPT等大语言模型的突破与局限性、神经科学对AI研究启发、空间智能发展潜力等。
本期长期主义,选择李飞飞最新a16z对话、李飞飞最新CHM Live现场访谈、空间智能公司World Labs正式亮相,有新Newin、Web3天空之城、机器之心发布,六合商业研选精校,分享给大家,Enjoy!
李飞飞最新a16z对话:空间智能不仅适用虚拟世界生成,还可融合现实世界,AI技术进步将带来无法想象的新应用场景
近日,李飞飞与a16z合伙人Martin
Casado、研究者Justin Johnson,展开讨论AI领域历史、现状、未来发展方向,涵盖AI技术各个层面,特别是生成式AI与空间智能未来潜力。
李飞飞强调,生成式AI在她研究生阶段就已经存在,早期技术不成熟。随着深度学习与算力飞跃,生成式AI在最近几年取得令人瞩目的进展,成为AI领域核心突破之一。
她还介绍最新创业项目World Labs,专注空间智能,机器在3D与4D空间中的理解与互动能力。她指出,空间智能不仅适用虚拟世界生成,还可以融合现实世界,广泛应用于增强现实AR、虚拟现实VR、机器人领域,AI技术进步,将为我们带来无法想象的新应用场景,包括虚拟世界生成、增强现实与物理世界交互。
Martin Casado
:
过去2年,我们看到一波涌现的消费级AI公司与技术,这个过程非常疯狂。你们已经在这个领域工作几十年,我们可能聊一下,你们在这个过程中做出的关键贡献、洞见。
李飞飞:
这是非常激动人心的时刻,回顾一下,AI正处于令人兴奋的时刻。
我个人已经从事这个领域超过20年,我们走出上一次AI寒冬,见证现代AI诞生。随后我们看到深度学习兴起,它向我们展示各种可能性,比如下棋。
我们开始看到技术深入发展、行业对早期可能性的应用,比如语言模型。现在,我认为我们正处在寒武纪大爆发中。
某种意义上说,现在除了文本,我们看到像素、视频、音频等,都开始与AI应用与模型结合,这是非常令人兴奋的时刻。
Martin Casado
:
我认识你们很久,很多人也认识你们,你们在这个领域非常突出。
不是所有人都了解你们在AI领域起步,或许我们可以简单介绍一下你们背景,帮助观众建立基础认知。
Justin Johnson
:
我最初接触AI是在本科快结束时,我在加州理工学院Caltech学习数学与计算机科学,那段时间非常棒。在那期间,有一篇非常有名的论文发布,Home
Neck Lee与Andrew Ng等人在Google
Brain的猫论文,这是我第一次接触深度学习的概念。
这种技术让我感到惊艳,那是我第一次遇到这种配方,强大的通用学习算法、巨大的计算资源、大量数据结合在一起时,会发生一些神奇的事情。
我大约在2011年、2012年左右接触到这个想法,当时我觉得这将是我未来要做的事情。
要做这些工作必须读研究生,我发现李飞飞在斯坦福,她当时是世界上少数几位深入研究这一领域的人之一。当时是从事深度学习与计算机视觉的绝佳时机,这是技术从萌芽走向成熟,广泛应用的时刻。
那段时间,我们看到语言建模的开端,看到区分性计算机视觉的起步,你可以通过图片理解的内容。这段时间还出现我们今天称之为生成式AI的早期发展,生成图像、生成文本等算法核心部分,也是在我读博期间由学术界解决的。
当时每天早上醒来,我都会打开arXiv查看最新研究成果,就像拆圣诞礼物一样,几乎每天都有新发现。
过去2年,世界其他人开始意识到,每天通过AI技术,有新的圣诞礼物收到。对我们这些从事这个领域10多年的人说,这种体验早就有了。
李飞飞:
我比Justin要年长得多,我是从物理学进入AI领域,本科背景是物理学。
物理学是一门教你思考大胆问题的学科,比如世界上未解之谜。物理学中,这些问题可能与原子世界、宇宙相关,这种训练让我产生对另一个问题的兴趣,智能。
我在加州理工学院做了AI与计算神经科学的博士研究,Justin与我没有在加州理工学院重叠过,但我们共享相同母校。
Justin Johnson
:
还有相同的导师?
李飞飞:
你的本科导师,也是我博士导师Pietro
Perona。
我读博期间,AI在公众视野里正处于寒冬,但在我眼中并非如此。
这更像是春天前的冬眠期,机器学习与生成模型正在蓄积力量。我认为我是机器学习领域的本地人,Justin那一代是深度学习的原住民。
在我博士结束、担任助理教授期间,我的学生与我实验室意识到,有一个被忽视的AI元素在驱动泛化能力,这个领域当时并未深入思考,那就是数据。
我们当时专注贝叶斯模型等复杂模型,忽略让数据驱动模型的重要性。
这是我们押注ImageNet原因之一,当时所有领域的数据集规模都很小,计算机视觉与自然语言处理的标准数据集,都是几千或几万条数据,我们意识到需要提升到互联网规模。幸运的是,互联网时代正在崛起,我们乘上这股浪潮,也正是在这个时候我来到斯坦福。
Martin Casado
:
这些时代就像我们经常谈论的,比如ImageNet是推动或至少是让计算机视觉在生成式AI领域中流行,并具备可行性的重要时代。
我们通常会提到两个关键突破:一个是Transformer论文,注意力机制attention,另一个是较少谈到的稳定扩散stable diffusion。
用这种方式来理解这两个来自学术界,尤其是谷歌的算法突破是否合理?或者说这更是一个有意为之的过程?亦或是还有其他一些不常被提及的重大突破,推动了我们走到今天?
Justin Johnson
:
我认为最大突破在于算力。我知道AI的故事,往往也是算力的故事,即便人们经常提到它,我认为它的影响还是被低估。
过去10年,我们在算力上看到的增长是惊人的。被认为是深度学习在计算机视觉领域突破性时刻的第一篇论文是AlexNet,这是一篇2012年的论文,深度神经网络在ImageNet挑战赛中表现出色,远超其他当时算法。
在研究生期间,你可能会接触到的算法,与AlexNet相比相形见绌。AlexNet是一个拥有6,000万个参数的深度神经网络,它在2张GTX 580显卡上训练6天,GTX 580是当时最强大的消费级显卡,2010年发布。
我昨晚查了一些数据,想把这些放在一个更大的背景中看待。英伟达最新显卡是GB200,你们猜一下GTX 580与GB200之间算力差距有多大?
数量在几千左右,我昨晚算了一下数据。像是那2周的训练,那6天是在2块GTX 580上运行,如果扩展一下,大概可以在一块GB200上运行不到5分钟。
这样想的话,真的有个很好的论点,2012年AlexNet在ImageNet挑战赛上的论文,真的是一个非常经典的模型,那就是卷积神经网络模型。
这个概念早在1980年代就已经出现,我记得作为研究生学习的第一篇论文,内容也差不多,有六七层网络结构。AlexNet与卷积神经网络模型唯一区别,几乎就是GPU,使用2个GPU与海量数据。
我要说的是,大多数人现在都熟悉痛苦的教训bitter lesson,这个教训说的是,如果你开发一个算法,只要确保你能利用现有计算资源,这些资源会逐渐变得可用,你只需要一个能够不断进步的系统。
另一方面,似乎还有另一个同样有说服力的观点,那就是新的数据源解锁深度学习,ImageNet就是很好的例子。
很多人认为自注意力机制对Transformer模型很重要,他们也会说这是利用人工标注数据的一种方式。
人类为句子结构提供标注,如果你看CLIP模型,它是通过互联网让人类使用alt标签来标记图片。
答案是两者兼有,还是更偏向某一方?我认为是两者兼有,你也提到另一个非常关键的点。
Martin Casado
:
我觉得在算法领域中,有两个明显不同的时代。
ImageNet时代是监督学习的时代。这个时代,我们有很多数据,我们不知道如何仅凭数据来训练。
ImageNet与其他同时期数据集的预期是,我们会有大量图像,我们需要人类对每张图像进行标注。我们训练的所有数据,都是由人类标注员逐一查看,标注的。
算法的重大突破在于,我们现在知道如何在不依赖人类标注的数据上进行训练。对于一个没有AI背景的普通人,似乎如果你在训练人类数据,人类已经进行标注,只是这种标注并不是显式的。
Justin Johnson
:
哲学上说,这是非常重要的问题,这个问题在语言领域比在图像领域更为真实,我确实认为这是一个重要的区别。
CLIP确实是由人类标注,我认为自注意力机制是人类已经理解了事物之间的关系,然后你通过这些关系进行学习。
它仍然是由人类标注,这种标注是隐式的,不是显式的。区别在于,监督学习时代,我们学习任务受到更多限制,我们必须设计出一套我们想要发现的概念本体论。
比如ImageNet中,李飞飞与她的学生们花了很多时间思考ImageNet挑战赛中一千个类别应该是什么。同时期其他数据集,如用于目标检测的COCO数据集,他们花了很多心思决定放入哪些80个类别。
Martin Casado
:
让我们谈谈生成式AI。当我攻读博士学位时,在你们出现之前,我上过Andrew Ng机器学习课程,还学过Daphne Koller非常复杂的贝叶斯课程,对我说这些都很复杂。
当时很多内容都是预测建模。我记得你解锁了整个视觉领域的东西,生成式AI大约是在过去4年中才出现。这对我是完全不同的领域,你不再是识别物体,也不是在预测什么,而是在生成新的东西。
也许我们可以谈谈是什么关键因素,让生成式AI得以实现,它与之前不同之处,们是否应该以不同的方式看待它,它是否是一个连续发展部分,还是另一个全新领域?
李飞飞:
这非常有趣,即使在我研究生时代,生成模型就已经存在。我们当时想做生成,只没人记得,即使是用字母与数字做生成,我们也在尝试一些事情。
Jeff Hinton当时有一些关于生成的论文,我们也在思考如何生成。
如果你从概率分布角度看,数学上是可以进行生成的,只是当时生成的东西根本无法让人感到惊艳。
尽管从数学理论上看生成概念是存在的,没有任何生成效果让人感到满意。
我想特别提到一位博士生,他在深度学习方面有着浓厚兴趣,来到我的实验室。这个博士生的整个博士学习经历,几乎可以说是这个领域发展轨迹的缩影。
他第一个项目是数据,我逼着他做,尽管他不喜欢,事后他承认学到很多有用的东西,现在我很高兴你能这么说。
我们转向深度学习,核心问题是如何从图像生成文字,这个过程中有三个明确的阶段。
我们有图像,也有文字,接下来我们要看它们之间关联度。我第一篇学术论文,也是我第一篇博士论文,研究的是基于场景图的图像检索。
接下来,我们继续深入研究,从像素生成文字,这方面他与Andrej都做了很多工作,依然是一种非常有损的生成方式,信息从像素世界中获取时,损失很大。
中间阶段有一个非常著名的工作,那时有人第一次实现实时化。
2015年,《神经算法的艺术风格》论文,由Leon Gatys领导发表,他们展示将现实世界照片转换为梵高风格的图片。
我们现在可能习以为常,但那是在2015年,那篇论文突然出现在arXiv上,震惊了我,我感觉大脑中被注入一种生成AI的病毒。我心想,我需要理解这个算法,玩一玩,试着把自己图片变成梵高风格。
我花了一个长周末重新实现这个算法,让它能够正常运行。它是非常简单的算法,我的实现大概只有300行代码,当时是用Lua写的,那时候没有PyTorch,我们用的是Lua Torch。
尽管算法简单,它的速度很慢。每生成一张图片,都需要运行优化循环,耗费很多时间。生成的图片很漂亮,但我就是希望它能更快一点。最后,我们确实让它变快了。
还有一点我非常自豪的是,生成AI真正走向世界之前,他在博士研究的最后一部分,做了非常前沿的工作。这个项目是通过输入自然语言来生成完整图像,这可以说是最早生成AI工作之一。
我们使用的是GANs,当时它非常难用。问题是,我们还没有准备好用自然语言来描述一幅完整的图像。
他采用一个场景图结构输入方式,输入内容是羊群、草地、天空等,用这种方式生成一幅完整的图像。
从数据匹配到风格转换,再到生成图像,我们逐渐看到一个完整的转变。
你问这是否是一个巨大变化,对于像我们这样的人说,这是一个持续的过程,但对大众而言,成果确实显得突然、具有冲击力。
Martin Casado
:
我读了你的书,真是一本很棒的书,我强烈推荐大家读。
我想说的是,长期以来,你的很多研究与方向都聚焦空间智能、像素处理等领域。现在你在做的World Labs,也与空间智能相关。
能谈谈这是你长期旅程的一部分吗?你为什么现在决定做这个?这是否是某种技术突破或个人原因?你能否带我们从AI研究的背景,过渡到World Labs?
李飞飞:
对我说,这既是个人追求,也是智力上旅程。你提到我的书,我的整个智力旅程是一种对北极星的追寻,也坚信这些北极星对我们领域的进步至关重要。
一开始的时候,我记得研究生毕业后,我认为我的北极星是为图像讲故事,对我来说,这是视觉智能的一个重要组成部分,也就是你所说的AI的一部分。
当Justin与Andrej完成他们工作时,我想,这就是我一生的梦想,我接下来要做什么?这个进展,比我预期的快得多,我本以为需要100年才能实现这些。
视觉智能始终是我的热情所在,我坚信,对于每一个有智能的存在,比如人类、机器人,或者其他形式的存在,学会如何看待这个世界、如何推理、如何与世界互动至关重要。无论是导航、操控、制造,甚至是构建文明,视觉与空间智能都在扮演基础性角色。
它的基础性可能与语言一样,甚至在某些方面更加古老与基本。World Labs的北极星,就是解锁空间智能,现在是正确时机。
就像Justin说的那样,我们已经具备所需的资源,算力与对数据更深的理解。
与ImageNet时代相比,我们在数据理解上,变得更加复杂。
我们拥有算法方面的进展,比如我们共同创始人Ben Mildenhall与Christoph Lassner在Nerf方面的前沿工作。我们觉得现在是下定决心、专注这一领域,并解锁潜力的最佳时机。
Martin Casado
:
为让大家理解清楚,你现在创办World
Labs,你们要解决的问题是空间智能。你能简明扼要描述一下,什么是空间智能?
李飞飞:
空间智能,指的是机器理解、感知、推理,并在3D空间与时间中,采取行动的能力。具体说,它是指理解物体与事件,如何在3D空间与时间中定位,世界中的交互如何影响这些3D位置。
这不仅是让机器停留在数据中心或主机中,而是让它走向现实世界,理解这个丰富的3D、4D世界。
Martin Casado
:
你说的这个世界,是指现实的物理世界,还是抽象概念上的世界?
即使你是在生成虚拟世界或内容,定位3D中,仍然有很多好处。或者当你在识别现实世界时,能够将3D理解应用到真实世界中也是其中的一部分。
Martin Casado
:
你们共同创始人团队,真是非常强大,你觉得为什么现在是做这件事的合适时机?
李飞飞:
这是长期进化的过程。博士毕业后,我开始寻找成为独立研究员的道路,思考AI与计算机视觉领域中大问题。
当时我得出结论是,过去10年,主要是在理解已经存在的数据;接下来10年,将会是理解新的数据。
过去的数据,主要是网络上已经存在的图像与视频,未来的数据是全新的,智能手机出现了,这些手机有相机,有新的传感器,可以在3D世界中定位。这不仅是你从互联网上获取一堆像素,并试图判断这是一只猫,还是一只狗的问题。
我们希望把这些图像,当作与物理世界的通用传感器,帮助我们理解世界的3D与4D结构,无论是在物理空间,还是生成空间中。
博士毕业后,我做了很大的转变,进入3D计算机视觉领域,与我同事们一起研究如何预测物体的3D形状。后来,我对通过2D数据学习3D结构的想法,产生浓厚兴趣。
我们讨论数据时,常会提到,获取3D数据很难,但2D图像是3D世界的投影,这里有很多可以利用的数学结构。你有大量2D数据,你可以通过这些数学结构,推导出3D世界结构。
2020年,是一个突破性时刻。我们共同创始人Ben Mildenhall,提出Nerf神经辐射场方法,这是非常简单、清晰的方式,可以通过2D观测,推导出3D结构,点燃整个3D计算机视觉领域。
与此同时,LLM开始崭露头角。很多语言建模的工作,在学术界已经发展很长时间。即使在我博士阶段,我也与Andrej Karpathy在2014年进行了一些语言建模工作。
Justin Johnson
:
这是出现在Transformer之前的事情,到GPT-2时代,你在学术界已经很难再做这样的模型,它们需要的计算资源太大。有趣的是,Ben提出Nerf方法,只需在单个GPU上训练几个小时。
这让很多学术研究者,开始重新聚焦这些问题,可以在有限计算资源下,解决一些核心算法问题,你可以在单个GPU上获得最先进的成果。
当时很多学术研究者都在思考,我们如何通过核心算法,来推动这个领域发展?
李飞飞:
我们发现我们研究方向,某种程度上正朝着相似目标前进。
我还想讲述很有趣的技术问题,或者说关于像素的技术故事。
很多从事语言研究的人可能不知道,生成AI时代之前,我们这些从事计算机视觉领域的人,有一个很长的历史,叫3D重建的研究。
这可以追溯到20世纪70年代,你可以通过拍摄照片,人类有两只眼睛,可以用立体照片来尝试三角测量,构建3D形状。这是一个非常难的问题,至今尚未完全解决,存在匹配问题等复杂情况。
这个领域有着长期进展,当Nerf与生成方法结合,尤其是在扩散模型的背景下,3D重建与生成开始融合。计算机视觉领域内,我们发现,如果我们看到某个东西,或者想象某个东西,二者都可以汇聚到生成它的方向。这是一个非常重要的时刻,很多人可能没有注意到这一点,我们没有像谈论LLM那样广泛讨论它。
Justin Johnson
:
在像素空间中有重建,例如你重建一个真实场景;如果你看不到那个场景,会使用生成技术,这两者非常相似。整个对话中,你一直在谈论语言与像素,或许这是一个好时机来讨论空间智能与语言方法的对比,比如它们是互补的,还是完全不同的?
李飞飞:
我认为它们是互补的。我不确定如何定义完全不同,我可以尝试做个对比。
如今,很多人都在谈论GPT、开放AI、多模态模型。大家觉得这些模型,既能处理像素,也能处理语言。它们是否能实现我们想要的空间推理?为了回答这个问题,我们需要打开这些系统的黑箱,看它们是如何在底层工作。
语言模型与我们现在看到的多模态语言模型,底层的表示是一维的。我们谈论上下文长度、Transformer、序列、注意力机制,归根结底,这些模型的表示,是基于一维的序列化Token。
这种表示,在处理语言时非常自然文本本身就是由一维的离散字母序列组成。这种一维表示,是LLM成功的基础,现在我们看到的多模态LLM也是如此,它们将其他模态如图像硬塞进这种一维表示中。
在空间智能领域,我们思路正好相反,我们认为世界的三维本质应该成为表示的核心。从算法角度看,这为我们处理数据与获得不同类型的输出,提供新机会,帮助我们解决一些截然不同的问题。
即使一个粗略层面看,你可能会说,多模态LLM也能看图像。确实可以,但它们在处理图像时,没有将三维本质置于方法的核心。
Justin Johnson
:
我完全同意,讨论一维与三维表示的根本性区别,是非常核心的。
有一个稍微哲学化的观点,对我说同样重要:语言本质上是一种纯生成的信号,世界上不存在语言。你走到大自然中,不会看到天上写着文字。无论你输入什么数据,语言模型几乎都可以通过足够的泛化,将相同的数据吐出来,这就是语言生成的特质。
3D
世界不同,遵循物理法则,拥有自己结构与材料。能够从根本上提取信息,进行表示与生成,这是完全不同的问题。我们会借鉴语言模型中一些有用的想法,根本上说,这是一个不同的哲学问题。
Martin Casado
:
语言模型是一维的,可能是对物理世界的不良表示,它是人类生成的,带有损失。
另一个生成模型的模态是像素,2D图像与视频。如果你看视频,可以看到3D场景,摄像机可以平移,空间智能与2D视频有什么不同?
李飞飞:
这里有两点值得思考,一是底层的表示,二是用户体验的便利性,这两者有时会让人混淆。
我们感知的是2D,我们视网膜是二维结构,我们大脑将其视为三维世界的投影。
你可能希望移动物体、移动摄像机,原则上你可以用二维的表示与模型,来做这些事情,但它并不适合解决你提出的问题。
动态三维世界的二维投影,可能可以建模,但将三维表示放在模型核心,能够更好适应问题的需求。
我们目标是将更多三维表示融入模型心,从而为用户提供更好的体验,这也与我的北极星相关。为什么我们强调空间智能,而不是平面像素智能?
智能发展轨迹,回顾进化史,最终目的是让动物与人类能够在世界中自由移动、互动,进而创造文明,甚至是做一片三明治。将这种3D本质转化为技术,是释放无数潜在应用的关键,即便有些看起来只是表面上进步。
Martin Casado
:
我认为这是非常微妙,至关重要的观点。或许我们可以通过谈论一些应用场景,来进一步深入讨论。当我们谈论开发一种可以实现空间智能的技术模型时,它可能具体是什么样,有哪些潜在应用场景?
李飞飞:
我们设想的空间智能模型,可以做很多事情,一个让我特别兴奋的是世界生成。类似文本-图像生成器,我们现在已经有文本-视频生成器,输入一张图像或一段视频,系统能生成2秒钟的惊人片段,但我认为我们可以将这一体验提升到3D世界。
我们可以想象空间智能未来帮助我们将这些体验提升到3D,不仅生成一张图片或一段视频,而是生成完整、模拟、丰富的互动3D世界。也许用于游戏,也许用于虚拟摄影,应用领域广泛得令人难以想象。
Justin Johnson
:
我觉得这项技术,会随着时间推移逐渐进步。构建这些东西非常困难,静态问题可能会相对简单一些,从长远看,我们希望它是完全动态、可交互,正如你刚才所描述的一切。
李飞飞:
这正是空间智能的定义,我们会从更多静态问题开始,但你提到的所有内容,都在空间智能未来规划中。
Justin Johnson
:
这也体现在我们公司World Labs名字上,这个名字的含义,是关于构建与理解世界。
起初我们告诉别人这个名字时,他们不总是能理解,在计算机视觉、重建与生成领域,我们通常会对所能做的事情进行区分。
第一级是识别物体,比如麦克风、椅子等这些世界上的离散物体。许多ImageNet的工作,都与识别物体有关。
接下来我们提升到场景层次,场景由物体组成。例如,现在我们有一个录音室,里面有桌子、麦克风与坐在椅子上的人,这是物体的组合。
我们想象的世界,是超越场景的。场景可能是单一东西,我们希望打破这些界限,走出门外,走到街上,看到车流穿梭,看到树叶在风中摇动,并能够与这些东西互动。
借助这项技术,现实世界、虚拟想象世界或增强世界、预测世界之间的界限变得模糊。真实世界是3D的,数字世界中,必须有3D表示,才能与真实世界融合。你不能只用2D甚至1D,来有效与真实3D世界交互,这种能力解锁无限应用场景。
就像Justin提到的第一个应用场景,虚拟世界的生成可以用于任何用途。
第二个可能是增强现实。就在World Labs成立那段时间,苹果发布Vision Pro,他们使用空间计算这个词。我们几乎也在讲同样的事情,我们强调的是空间智能。空间计算需要空间智能,这一点毫无疑问。
我们不知道未来硬件形式会是什么样,可能是护目镜、眼镜,甚至隐形眼镜。但在真实世界与虚拟世界之间的界面,无论是增强你的工作能力、帮助你修理汽车,哪怕你不是专业技工,或者只是为娱乐提供类似Pokemon Go++的体验,这项技术将成为AR/VR操作系统。
Justin Johnson
:
极限情况下,AR设备需要做的事情就是一直陪伴你,实时理解你所看到的世界,帮助你完成日常生活中任务。我对此感到非常兴奋,尤其是虚拟与现实之间的融合。当你能够实时完美理解周围环境中3D时,它甚至可能取代现实世界中的一些事物。
比如,现在我们有各种不同尺寸屏幕,iPad、电脑显示器、电视、手表等,它们在不同场景中呈现信息。
如果我们能够无缝将虚拟内容与物理世界融合,这些设备不再必要。虚拟世界可以在正确时刻,用最合适方式向你展示所需信息。
另一项巨大应用,是混合数字虚拟世界与3D物理世界,尤其是机器人领域。机器人必须在物理世界中行动,它们计算与大脑在数字世界中,学习与行为之间的桥梁,必须由空间智能来搭建。
Martin Casado
:
你提到虚拟世界、增强现实,现在你又谈到纯粹的物理世界,比如用于机器人领域。这个方向非常广泛,尤其是如果你计划涉足这些不同领域。你们如何看待深度技术与这些具体应用领域的关系?
李飞飞:
我们认为自己是一家深度技术公司,作为一个平台公司,提供能够服务于这些不同应用场景的模型。至于哪个应用场景更适合我们一开始关注的,我觉得现在的设备还不够完善。
我在研究生时期,就拥有我的第一台VR头戴设备。当我戴上它时,我心里想,这太疯狂了。我相信很多人第一次使用VR时,都有类似体验。
我非常喜欢Vision Pro,发布的那天,我熬夜抢购一个。但现在作为大众市场的平台,它还未完全成熟。我们作为公司,可能会选择已经更为成熟的市场进入。
有时通用性中,也会有简洁性。我们有一个作为深度技术公司的愿景,相信有一些根本性的问题,需要被很好解决,如果解决得好,可以应用于多个不同领域。我们视公司的长期目标,为构建与实现空间智能的梦想。
Justin Johnson
:
我认为这就是你们所做的影响所在。
我不认为我们会真正完全到达那个终点,这是一个如此根本的事物,宇宙本质上是一个不断演化的四维结构,广义上的空间智能,就是理解这个结构的全部深度,找到所有的应用。我们今天有一套特定的想法,我相信这段旅程,会带我们去一些我们现在根本无法想象的地方。
李飞飞:
技术神奇之处就在于,它会不断打开更多可能性。我们会持续推进,这些可能性也会不断扩展。
博物馆CEO Daniel:
我已经在这里工作大约6年半。今晚的节目让我特别兴奋,它与我们的新使命完美契合,稍后我会详细介绍。
首先,我想感谢所有成员、受托人、支持者、志愿者、组织这些节目的工作人员。没有你们支持与帮助,我们无法做到这一切,感谢大家。
今天我们这里几乎座无虚席,正在进行在线直播,欢迎远道而来的观众。如果你不知道,博物馆大约6年前就制定了它的使命。我们将继续像所有收藏机构一样收藏与保存,为子孙后代而努力。
我们也非常关心人类,起初人类是计算机创造者,后来我们发明计算机。现在没有计算机,生命无法想象。该机构的使命已经演变为解码技术,解码计算的过去,从中获得启示;数字化的现在,这是一个不断变化的目标,以及未来对人类状况的影响。
我很高兴欢迎李飞飞博士参加今晚的节目,她在《我眼中的世界》一书中的故事,在个人层面上非常深刻,以世界级与权威的专业水平,述了计算对人类状况的影响。我们确实相信所有这些技术,都可以用于更大利益,这也是我们在该机构的目标,帮助人们认识到,考虑如何最好利用这些技术来造福社会。
我还要感谢今晚赞助商帕特里克·J·麦戈文基金会,我们无法大规模开展这类项目,麦戈文基金会一直是了不起支持者。帕特·麦戈文不久前去世,他是这个博物馆创始董事之一,他的家乡是波士顿,博物馆最初就是在那里建立,在20多年前搬到湾区。我们要感谢他们对AI与人类状况系列的支持。
我想你们来这里,是你们对AI与人类状况了解很多,或者你们有兴趣了解更多。
让我先介绍一下李飞飞的背景,她是斯坦福大学红杉计算机科学教授,也是斯坦福以人为本的AI研究所的Denning联席主任。她曾担任斯坦福大学AI实验室主任,休假期间担任谷歌AI与机器学习首席科学家副总裁。那段时间里,她做了大量的研究。她还在国会与白宫委托的国家AI研究资源工作组任职,请允许我欢迎李博士上台。
很久以前,我有幸在白宫科学、技术与工程办公室工作时,认识汤姆,他在技术与政策方面经验丰富。
在奥巴马政府期间,他曾与克林顿政府、奥巴马政府合作,在政策领域拥有丰富经验,在国家纳米技术计划与大脑计划中积极工作。
他现在是复兴慈善组织CEO,这是新组织,专注考虑这种新的复兴。我们正在经历这种复兴,在许多情况下,我们正在社区中创造这种复兴。
我要为此感谢汤姆与李飞飞。感谢大家参加这个节目,与我一起欢迎他们上台。
汤姆·哈利尔:
谢谢。每个人都必须冲出去买这本书,也给你的朋友与亲戚买一些。这是一本很棒的书。飞飞,我们必须看看这个观众有多书呆子。你们中有多少人,可以向别人解释随机评级、异议与反向传播是如何工作的?举手。
飞飞,你在书中谈到的一件事是关于AI的历史。我想知道你是否可以从1956年发生的事情开始?当时的研究人员,花了多长时间才意识到他们能够解决AI问题?
李飞飞:
首先,谢谢你,谢谢计算机历史博物馆。谢谢Daniel与汤姆邀请我。我想对庆祝农历的人说,今天是中秋节快乐。现在,让我们回到1956年,那不是达特茅斯研讨会,对吧?
我以为那是1959年,我的记忆已经模糊。在座有真正的历史学家,我知道。
1956年,达特茅斯学院一个闷热的夏天。AI创始人约翰·麦卡锡、马文·明斯基、克劳德·香农。第四个人是谁?还有一个人。对不起。我们会记住这一点。还召集了一群计算机科学家,我想是在DARPA的一小笔资助下,讨论未来的计算。
当时,约翰·麦卡锡刚开创这个领域,称之为AI。他们在那个夏天的研讨会上撰写了一份关于AI是什么的白皮书,探讨AI功能、解决问题的方法,特别是推理与演绎推理,试图让机器像人类一样思考、回答问题、做出决定。
这是一段相当漫长的旅程,已经有70多年。我们经历起起落落,见证多次炒作周期。
比如在20世纪70年代,关于专家系统的炒作周期,当时开始看到在AI中使用一阶逻辑与专家系统的实际应用。后来泡沫破灭,它没有实现。
当时有杂志封面谈论机器人接管社会,这并没有实现。资金真的枯竭,学术界与工业界的资金都枯竭。军事资金或国防资金仍然存在,但一些研究人员避开这些资金来源。总的来说,整个领域都萎缩。
到20世纪90年代,AI领域开始发生一场静悄悄的革命。公众仍然将那段时期视为AI冬季,我个人认为那是初春,绿芽萌发。没错,雪还没有完全融化。
这场革命首先是由统计建模驱动,统计建模与计算机编程相结合,我们开始称之为机器学习。AI与机器学习领域找到自己语言,通过统计与机器学习,开始破解自然语言编程、计算机视觉、语音识别等各个领域,研究人员开始以相当深入方式研究这些领域。
就我个人而言,我在2000年进入加州理工学院攻读博士学位,进入AI领域。
很多公众仍然认为那是AI冬季,对我来说,在我攻读博士学位期间,发生两件事,这两件事定义我这一代AI研究人员。
一个是统计机器学习,我在研究生院第一堂课,是我走进的第一堂课,叫神经网络与模式识别。
我们阅读反向传播的论文,也研究支持向量机、贝叶斯网络、增强方法与核方法等。这是我们经历的一部分,我们利用这些工具开始研究计算机视觉等AI问题。
我认为在我们实验室与学术界之外,互联网在AI发展中起到决定性作用。
谷歌大约在1999年或2000年成立,互联网开始为我们提供数据。大约10年后,GPU开始出现,事情逐渐趋于一致。
我认为,2010年~2012年左右,AI的公共时刻真正到来。
至少在硅谷,当谷歌与其他公司试图收购一家可能甚至没有名字的小型初创公司时,公众开始关注它。这家初创公司来自多伦多大学,赢得ImageNet挑战赛。
汤姆·哈利尔:
对。你参与的一个项目,在改变人们对可能性的看法方面,发挥非常重要的作用,那就是ImageNet。
你与同事们创建包含1,500万张照片的数据集,给它们贴上标签。为什么这在帮助启动现代AI浪潮中,发挥如此重要的作用?
李飞飞:
对。对于不知道的人,ImageNet是一个数据集项目,始于2006年,花了几年时间,2009年发布。
它成为AI领域最大的一个数据集,由1,500万张互联网图像组成,经过人工分类、整理、组织、分类,涵盖22,000个自然物体类别。
在我们发布ImageNet作为开源数据集后,我们立即让研究界参与年度ImageNet挑战赛,邀请全球机器学习研究人员与计算机视觉研究人员,参与这个我们称之为物体识别的年度挑战赛。
这项年度挑战赛,始于2010年,2012年取得成果,那1年,挑战赛第一名就是现在众所周知的AlexNet。
这是多伦多大学研究人员成果,包括Geoffrey Hinton、Ilya、Alex。那一刻,对AI世界来说具有象征意义,现代AI的三个基本要素汇聚在一起。
其中之一是首次聚合的能力,神经网络。这就是汤姆考你反向传播的原因,那是神经网络的底层数学,第一个元素是神经网络。
ImageNet
的重要性在于,它在今天看来微不足道。每个人都知道AI由数据驱动,但在ImageNet之前,人们不相信数据。每个人都在研究完全不同的AI范式,只使用少量数据,有时甚至没有数据,就像手工制作的特征工程。
这个非常激进的想法是,从头开始就拥有所有这些,在数据模型中使用数据,用数据驱动的方法驱动高容量模型,推动AI的泛化,许多人对此深表怀疑。因此,没有这种观点,认为神经网络是一种通用函数逼近器。如果你给它们足够多的例子,它们就可以在输入之间进行映射,学习一个在输入与输出之间进行映射的函数。
这不是主流观点,很多更资深的同事都想知道你为什么这样做。
我认为这是一个很例子,如果你相信某件事,有时候你应该坚持做下去,它会产生巨大影响,即使你当时没有得到同事们的喜爱。
我不是从消极的角度写的。我认为这是科学进步,就是受到挑战,无论是你前辈、后辈,还是你的学生,我不断受到学生挑战。
我可能每天都有99个愚蠢的想法,也许偶尔会有一个好主意。受到挑战是件好事,这是一个未经检验的想法,没关系。
特别是对年轻人,仅仅你受到挑战,并不意味着你应该放弃,这是这里重要的一课。
汤姆·哈利尔:
从2012年~2024年,你认为在此期间,我们取得哪些最重要进展?
李飞飞:
AI领域,对。信不信由你,2012年也是Jennifer怀疑的同1年,她的同事发现CRISPR。2012年是一个重要的年份。当时我与人讨论,发现同年出现两项重大科学技术突破。从2012年到现在,已经过去12年,这期间发生了许多重要事件。
在这个领域,尤其是更多研究领域,我认为Alex与ImageNet的出现是一个重要时刻。它为先驱者打开大门,包括像谷歌这样的科技巨头,开始加倍投入深度学习,这标志着深度学习时代的开始。
2016年1月,AlphaGo与围棋大师李世石对战,并赢得比赛,这是一个公开的时刻。
我认为那是公众第一次意识到机器足够强大,可以在人类认为只有我们才能完成的任务上挑战人类。它还引入强化学习的新算法,这种算法位于深度学习之上。
从2016年~2022年,对AI、大型科技巨头与创业的投资逐渐增加。这段时间,也与技术冲突的首次出现相吻合。
对于我们很多人来说,技术冲突发生在剑桥分析公司事件之后,也就是2016年大选期间。那时,机器学习偏见被指出,自动驾驶汽车死亡事件也在2017年左右发生。我们开始进行社会对话,在对技术的兴奋与对技术的担忧之间,产生紧张关系。
所有这些,都积累在2022年10月底,当时ChatGPT出现。对于我们这些研究人员来说,我们看到这种情况正在发生。
作为斯坦福人类中心研究所联席主任,我们在2021年成立世界上第一个基础模型研究中心,我们看到GPT-2的结果。
当时,公众还没有意识到,但像我们这样的研究人员已经意识到这一点。我同事Persi Leong与Chris Manning也意识到,这种情况将会改变,我们立即投入资源组建这个中心。
ChatGPT
出现时,我们很庆幸我们开始这件事,我们也对媒体关注度的上升感到震惊。
我认为,AlphaGo时刻、ChatGPT时刻,在公众意识方面的差异,不仅是人数的问题,这是AI第一次如此亲密掌握在个人用户手中。AlphaGo不在围棋大师以外的任何用户手中,ChatGPT就在你指尖。这是一个觉醒的时刻,不仅对每个人如此,对政府也是如此。
ChatGPT之前,我们研究所的部分使命,是弥合技术世界与政策世界之间差距。
你在华盛顿,我不会自然而然一直飞往华盛顿,我去华盛顿只是为了继续对话。
但在ChatGPT之后,华盛顿就像在召唤我们一样。就像,发生了什么事?我认为这10年真的,我的意思是,公众将其视为离散的事件点。我们认为这是一个连续的过程,只是越来越多投资与运动。
汤姆·哈利尔:
研究界是否仍在争论这些大型语言模型是随机鹦鹉,还是它们有实际的推理在进行?你对这场辩论有什么看法?
李飞飞:
我理解你为什么使用随机鹦鹉这个词,它来自一篇批评大型语言模型的论文。我认为重要的是,要认识到我们确实需要从不同角度批评这些模型,包括能力、能耗、局限性、偏见等,我不会称它为随机鹦鹉。
科学角度看,我认为重要的是使用更中性的语气,而不是称它为上帝或鹦鹉。它确实是一个大型模型,不仅具有模式匹配、模式学习的能力,还具有预测能力,能够展示某种程度的推理能力,它能够向你解释事物是什么。
我知道几天前刚发布一个新版本,我个人还没有时间测试它,它将推理能力提升到另一个阶段。我认为可以说,它确实具有模式识别能力,有些人可能称之为鹦鹉学舌的能力,它也具有一定程度的推理能力。
作为一名教育工作者,我总是非常小心,不要夸大这种推理是什么,包括一些更夸张的推断,比如感知或意识。
汤姆·哈利尔:
未来3~5年内,你认为可能会发生什么?你认为目前存在的系统,最大局限性是什么?你认为我们可以更好利用哪些领域?我们如何才能在提高性能方面,取得真正的进展?
李飞飞:
我不确定你是在狭义问语言模型,还是在问AI。
例如,有些人认为,只要购买更多GPU,我们就能取得令人难以置信的进步,比如购买200万个GPU,而不是2个GPU。还有,更多数据,更多合成数据。
我们知道,Transformers与注意力机制是当前技术核心。有些人认为,只要扩大现有技术规模,我们就能取得令人难以置信的进步。
还有一些人认为,今天AI版本有根本性局限性,我们将不得不探索新方法,比如神经符号方法或类似东西。
我确实认为我们正处于一场真正的AI数字革命中,未来3~5年,将继续是技术非常令人兴奋的时期,也会给我们社会包括政策带来紧张局势。
首先,我从根本上相信,在人类历史每一个阶段,技术与科学都是有限的,我们总是可以推动前沿向前发展。
就我个人而言,我对空间智能感到非常兴奋,这远远超出语言的范畴。如果你看人类与动物智能,语言只是智能的一部分。即使我们研究的是高级智能,人类也已经建立超越语言的文明。
从金字塔的建造,到第一次工业革命机器的复杂设计,DNA结构的发现,电影摄影的创造等,很多都是建立在超越语言的空间智能之上。除了语言之外,肯定还有新的大门打开了。
技术上讲,数据的缩放定律仍然有效,我们仍然看到数据缩放定律非常健康的证据。
同样非常有趣的是,我们越来越多听到关于我们在何处达到数据极限的消息,尤其是互联网上基于文本的数据,我们很可能已经到达极限。
但就我所处的高等教育领域,我还看到,很多科学发现领域,数据甚至还没有得到妥善收集。从这些数据的数字化,到这些数据的建模,我认为在未来3~5年内,由于AI与机器学习,我们将看到不同领域的科学发现蓬勃发展,不仅是大型基础模型的商业化,我们将看到更多的空间智能。
我个人参与,并对此感到兴奋。未来3~5年,不仅是技术发展的岁月,也是我们如何部署与管理这些模型的关键时期。
在加利福尼亚州,正在讨论AI法案。就我个人而言,我既支持安全措施,也支持政策措施。我也担心,即使是善意的法案,也可能对科学与开源社区,产生意想不到的负面影响,这一切肯定会在未来3~5年内显现出来。
汤姆·哈利尔:
我想回到政策问题上,首先请你为观众多描述一下你所说的空间智能。计算机能够看、做、学习,意味着什么,我们如何知道我们在空间智能方面是否取得进展?
你在斯坦福大学一位同事切尔西·芬恩说,我们距离让机器人出现在它从未见过的房子里还很远。比如说,距离吃早餐还有多远?非常远。我等不及了,但还很远。
李飞飞:
追溯人类语言的发展,这仍然是一个科学研究领域。人类语言历史上最早的原始语言,大约是在一两百万年前被发明的。很多人说我们今天使用的语言,是在过去30万年内发展起来的。
如果追溯到观察空间、三维世界、了解正在发生的事情,观察障碍物、观察食物、了解如何导航与推理的能力,它可以追溯到5.4亿年前,那是水下动物世界首次发展出光传感器的时候。
有了这种能力,感知就开始了。动物开始以一种专注的方式移动,在那之前,它们只是漂浮着。它们可能触摸一些东西,早期有触觉传感器,但那非常非常冷。
一旦你能看到,你就开始发展空间智能。你开始规划你的生活,开始看到食物,开始躲起来,不成为别人的食物,智力的进化过程才刚刚开始。
空间智能,总结了所有这些能力。用今天的话说,它是理解、推理、生成与3D世界互动的能力。现在,我们同时生活在物理世界与数字世界中,这种空间智能适用于这两个世界。
如果你想要一个可以到你家做早餐的机器人,机器人需要具备的最重要的能力之一就是空间智能。机器人需要知道你的冰箱在哪里,炉子在哪里,鸡蛋在哪里,如何打开鸡蛋,并把它放进锅里等,这些都是空间智能的一部分。
汤姆·哈利尔:
关于AI的概念,有很多讨论。我想知道你是否认为这是一个有用的概念。人们通常认为这将是可能的,也许让我们把机器人放在一边,那有点遥远。但是,如果你想象一个远程工作者,你将能够拥有一个AI,它可以做人类所做的每件有用的、经济上有用的事情,我们就可以用一些AGI来做。
首先,你认为这是一个有用的概念吗?第二,有些人说,那将在3年内实现。你认为这有点过于乐观吗?
李飞飞:
这是个好问题,也是一个硅谷问题,这就是我们现在的处境。
有时在我的脑海里,我会与AI先驱约翰·麦卡锡、马文·明斯基,还有艾伦·图灵进行对话。
他可能不会称自己为AI先驱,当他向人类提出思考机器的问题时,最终转化为图灵测试,他还没有考虑AI这个词,它还没有被发明出来。
当我与这些巨头对话时,我认为他们对AI的定义非常相似,它是智能的一般能力。如果他们这样称呼AI,作为一名学者,我很难区分AI与AGI,我认为它们有很大重叠。如果你看看AGI这个术语的出现时间,可能还不到10年。它更多来自行业,行业营销世界,这没有什么不好的。
从学术、科学、技术研究人员、教育工作者角度看,你们中一些读过我书的人,知道我经常使用北极星这个词。
作为一名科学家,我们追逐我们一生中可能永远无法解决的最难问题,但它们激励着我们。我认为,AI领域的北极星始终是通用能力。
我对AGI这个词有什么看法?没有人问我,他们什么时候发明了这个词。没关系,但我们热爱,仍然相信AI领域与这个定义,在很大程度上是重叠的。
现在,3年后,我们会实现这一目标吗?如果我站在风险投资家面前,我当然会说是的。实际上,你不会这么说,我认为我们需要负责任。
这意味着什么?机器会在重要任务上超越人类吗?我们已经在一些任务上做到了。
例如,2006年,DARPA无人驾驶汽车大挑战中,我的同事Sebastian Thrun与他的团队驾驶一辆汽车,在内华达州沙漠中行驶138英里,这是一种令人难以置信的能力。
我们有可以翻译数十种语言的机器,这简直是超人般的能力。我们在很多任务上,已经超越人类,比如AlphaFold与AlphaGo。
即使是ImageNet,也有1,000个神秘的物体类别,比如星鼻鼹鼠与各种种类的狗,这些都是超人的能力。
我认为我们已经取得一些成就,将继续取得更多成就。但是,如果没有明确定义,我不相信在3年内,我们能实现像人类一样聪明、像人类一样错综复杂的整体性。
汤姆·哈利尔:
让我们来谈谈你在斯坦福大学以人为本的AI计划中所做的工作。首先,你所说的以人为本的AI是什么意思?
李飞飞:
这个问题问得很好。我认为,以人为本的AI对我来说,是一个思考我的、你的AI工作的框架。
AI是由人制造,由人使用,将影响人们生活,思考这项技术的指导框架是什么?
2018年3月,我还是谷歌首席科学家时,我在《纽约时报》写了一篇文章,将这一框架称为以人为本的AI,正是我在谷歌的工作给我很大启发。
我有机会与许多企业进行交流,从日本个人开发者、使用AI的黄瓜种植者,一直到希望利用AI彻底改变整个商业模式的财富50强公司。
我意识到这项技术,比我想象的任何东西都要大。这项技术将以如此深刻的方式影响我们生活、企业、世界,这种认识让我不寒而栗。意识到一个工具,可以如此强大,是令人恐惧的,我们最好考虑一下的含义。
对我来说,这种深刻的含义,必须植根于人类的意义。当我想到这一点时,我与斯坦福大学同事们提出一个观点:我们需要用以人为本的框架来处理AI。
在斯坦福大学HAI,我们用三个同心圆来思考AI对人类的影响:个人、社区、社会。
如果你是一名艺术家,你是如何利用它来增强你的创作?还是它剥夺你的知识产权?
如果你是一名病人,这项技术是否让你在不剥夺你人格尊严的情况下,更好康复?
如果你是一名学生,你是如何通过这项技术的帮助,学习你感兴趣的任何内容?这些都是对个人的影响。
例如,对于无法去医院就诊、医生不足的社区,AI+远程医疗是一个非常用例。
有偏见的AI,是否会对一个社区产生比另一个社区更大的影响?我们已经看到这一点。
今天我们不能停止谈论AI在11月的影响,我们民主进程、AI、深度伪造与信息战,将如何改变这一切?我们不能停止谈论工作,从软件工程到卡车司机,再到放射科医生,AI正在影响整个社会。
所有这些,都是人类的问题。数学是干净的,人类世界是混乱的。
AI已经从拥有干净数学与编程的世界,进入了混乱的人类世界。有人曾经说过,技术很容易,人类很难,尤其是小孩子。
汤姆·哈利尔:
你最期待的AI,在环境健康等方面的潜在优势与应用有哪些?
这个领域真的是无边无际的,就我个人而言,我非常受启发,我父母病得很重,已经病了几十年。
我在初级保健、急诊科、手术室外与门诊护理环境中,度过无数小时,照顾我的母亲。这让我意识到,我们医疗保健系统,充满照顾他人的人。
这些医疗工作者,从护士、到医生、再到看护者,他们没有足够时间与帮助。
医疗保健环境中的环境智能,是我与斯坦福医学院同事之间合作的产物。我们希望利用技术,提供额外的眼睛与耳朵,帮助医生、护士与看护者确保病人安全,防止他们情况迅速恶化。
例如,很多人的家人与朋友都曾摔倒过。这是一种非常痛苦、代价高昂的伤害,尤其是对老年人。
如何预测这种情况?如何发出警报?如何帮助他们?如何帮助我们老年人或患者?让一个人24小时看护很难,电脑与摄像头可以提供帮助。环境智能可以帮助监测COPD患者的病情,在氧气快速变化或某些情况发生变化时提醒医生。
这只是AI几乎成为守护天使的一个例子,它可以增强我们看护者,照顾人们。
AI可以成为导师、助教,在不同学习环境中成为老师助手。我记得你一位前研究生安德烈正在研究这个问题,我几天前才见过他。
几年前,在深度学习革命开始之前,我曾有一个学生,与他人共同创办一家初创公司,使用计算机视觉技术检测田地里杂草,让农作物更健康。我还听说鲑鱼养殖户,使用AI来帮助养殖鲑鱼,AI的积极用途不胜枚举。
汤姆·哈利尔:
我们如何才能让更多人既拥有计算背景,又成为领域专家?
例如,你的同事Daphne Culler有机器学习背景,她也学到很多关于医疗保健与药物发现的知识。在我看来,在计算专业知识与领域专业知识两个领域都有涉猎的人,将能够帮助识别更多这些引人注目的用例。
李飞飞:
这是一个很观点,我深信跨学科与多学科方法的重要性。
即使你不想获得交叉领域的博士学位,我个人是在AI与计算神经科学的交叉领域,或者AI与计算生物学的交叉领域,或者AI与政治学的交叉领域获得知识。
即使你没有博士学位深入,跨学科的知识仍然非常有价值。在你作为学生的整个旅程中,拥抱计算、STEM领域、你热爱的领域,无论是生物学、艺术、政策还是化学等等都具有很大的价值。
对在校学生,无论你是在学校、考虑上大学还是已经在大学,我认为汤姆所说的真正有价值的是拥抱这种跨学科性。
广义上讲,AI是计算的新语言。我曾说过,只要有芯片的地方,就会有或将会出现AI。小到装有芯片的灯泡,大到机器人、汽车等,都会有AI。
鉴于这项技术的重要性,我确实相信要从小教育我们孩子,教育来自不同背景、各行各业的学生,教育我们公众这项技术,至少如果不是编码,也要知道这是什么。
即使你的热情不在计算、计算机编程或AI技术细节上,如果你的热情在艺术上,或者在政治学、法律、医学上,你也会有一席之地,领域专家将使用AI在你的领域做出改变。不要害怕从你的角度接受它,并用它来做出积极的改变。
汤姆·哈利尔:
人们列出很多潜在的风险,你已经谈到一些,人们将会失去工作,人们会利用深度伪造来扰乱选举,现有的偏见会进一步加深。有些人有更多推测性的担忧,比如工具收敛的想法。如果我们给AI系统一个目标函数,试图实现某个目标,它就会有子目标,想要复制自己,获得更多算力。
李飞飞:
这些风险中,我最重视的是哪种风险?风险很多。每一项技术,每一项强大的技术都可能造成伤害,被用于伤害,即使是善意的,也会产生意想不到的后果,我们必须面对这一点。
如果你强迫我选择一个风险,作为一名教育工作者,我会说拥抱AI新时代的最大风险,是无知。这不仅仅是基本的无知,比如不知道如何拼写AI这个词。
即使是一些学识渊博的人,当他们忽略细节与细微差别,以夸张的方式传达AI时,也会对社会构成风险。
如果我们对这项技术太无知,我们就会错过利用它为自己谋利的机会。如果我们对这项技术无知,我们无法指出或认识到实际风险。如果我们传播无知的信息,我们也在误导公众或政策制定。
这些问题的根源,源于缺乏了解,我们没有正确评估风险,或者我们夸张传达它,或者我们完全错过了它,这就是我的意思。
汤姆·哈利尔:
你现在看到哪些例子,人们说的话,你认为完全不着边际?
李飞飞:
我认为,任何说AI都是人,就好像在说技术都是,它只会带来好处,永远不会做坏事,我认为这是对过去的无知。
回顾人类使用工具的历史,每一种工具都被用于有害的地方。我们必须认识到,如果你的数据集有偏差,在公平性方面,你会受到非常严重的下游影响。
如果你不知道AI在哪里、如何制造,你可能真的太无知,在不知情的情况下使用深度伪造。这些都不好。
还有另一个转折点,那就是,这是一个恶魔,它的存在危机,它会自我扩散、自我复制,关闭电网等。
我认为这是夸张的,它忽略了AI不是一个抽象的概念,它存在物理系统中。即使它是虚拟软件、数字程序,它也存在物理系统中,它存在数据中心,它存在电网中,它存在人类社会中,有太多的东西是相互联系与情境化的。
汤姆·哈利尔:
提出这些更具推测性的担忧人中,有些人是像杰弗里·辛顿Jeffrey Hinton这样的人,他们大概了解这项技术。你为什么认为,过去几年,深入参与这项技术的人变得更加担忧?
李飞飞:
首先,我读研究生时就认识Jeffrey Hinton,我非常非常尊重他。2023年,我在多伦多,我与Jeffrey Hinton就这个问题进行公开讨论,视频在YouTube上。
我认为这是Jeffrey Hinton与我,或者Jeffrey
Hinton与任何人,就这个问题进行公开讨论的极少数几次之一。
如果你仔细听他说话,你会发现他很担心,他还指出潜在风险。
但是,他的担忧还有一层放大,我们必须分开。我完全尊重与Jeff的讨论,我同意他的观点。
不负责任使用这项技术,将会导致非常可怕后果。他对不负责任的使用,有自己的看法,我有自己不负责任的使用版本。
我还认为,我尊重每个人以自己方式呼吁这些风险,我也想成为一名负责任的传播者与教育者。
我想让公众知道,驾驭与管理这项技术,仍然是我们人类集体的责任。对,绝对有,不仅仅是时间。绝对有时间。还有,你知道,我们所做的一切都是在我们手中,我们不应该放弃。
汤姆·哈利尔:
你谈到治理,你在将国家研究云的想法,纳入政治议程方面,挥了非常重要的作用。如果你有机会向下任总统做简报,而他们问你该怎么办?关于美国最重要的事情,你会给下一任总统什么建议?政府可以做些什么来努力促进利益,同时也了解与管理风险?
李飞飞:
我可能会说2023年6月与2024年早些时候,我对拜登总统说的话。
我在国情咨文演讲中遇到他时,我相信我们国家需要一个非常健康的AI生态系统。当我说它是一个生态系统时,它包括公共部门、学术界、企业家精神。我们现在称小科技与大科技为技术。
我们国家是一个非常强大的民主国家,我们相信这种民主的价值。我相信拥有健康的AI生态系统,可以发挥我们优势,可以发挥非常积极的作用。
但是,我们可以做些什么来尝试?公共投资,公共投资真的非常重要。
现在我部分在私营部门工作,这让我更加确信私营部门投资,与公共部门对AI的投资之间的差异是如此巨大。
就像我的斯坦福,我与其他几位教员共享的斯坦福计算机视觉实验室没有H100,我们仍在使用A6000与其他较旧芯片,大型科技公司拥有数十万与数百万个芯片。
我认为公共部门投资,是思想花园与鲜花盛开的地方。如果不是公共部门,我们今天就不会在这里,我也不会在这里。
还有,Jeffrey Hinton是什么时候开始研究人工神经网络的?几十年前,他在CMU工作过,甚至可能更早,ImageNet来自公共部门。
未来3~5年,我们谈论的是科学发现。我们将看到令人兴奋的事情出现,很多将来自公共部门。来自公共部门、学术界的最东西,你猜怎么着?我们的人民,就是这样。我们需要投资公共部门。
汤姆·哈利尔:
我们的听众非常聪明,我相信你已经提出很多非常问题。让我们看看一个关于你新公司的问题。
你将如何收集足够的数据,来构建一个支持实时定位的世界空间地图?数据是关键,没有数据,你将无法在空间智能方面取得进展,也许你可以解决这个问题。
李飞飞:
我们尚未公开讨论细节,我们还没有准备好。当我们准备好时,我们会的。我觉得有趣的是,有人已经知道我们在做什么。那是他们的故事版本,我对此不做评论。
AI
是由数据驱动,这很重要。我们公司的空间智能绝对是基于像素的,大量像素数据将推动这项技术的发展。
汤姆·哈利尔:
这是艾米提出的一个很好的问题,这与你从事的一项工作有关,即全民AI。她说:我是一个12岁的中学生。我们可以做些什么来鼓励更多女孩学习AI,更好为AI时代做好准备?
李飞飞:
这是个好问题。我认为应该鼓励每个12岁的孩子接受这一点,不管你是女孩还是男孩,不管你住在农村还是硅谷,如果你喜欢它,就接受它。
对于艾米来说,我12岁时,还没有AI,至少我不知道有AI,我喜欢数学与物理。
今天,我感激父母与老师对我做的一件事,我会告诉艾米与所有学生,追随你的激情,追随你的好奇心,保持坚韧。
如果有负面的声音,就忽略它。有很多人,从你父母到老师,从你朋友到样,都在支持你。继续做下去,继续前进。
汤姆·哈利尔:
除了做早餐之外,用空间智能解决的最重要的人类问题是什么?
空间智能真的可以为很多事情提供动力,从创造到设计。你们中有多少人,只想要一个应用程序,可以想象所有的家具重新布置,机器人、AR、VR,到特定领域,无论是教学、学习、医疗保健、工厂、制造业等等。它真的是一种非常普遍的横向技术,可以影响所有这些领域。
汤姆·哈利尔:
我们还有关于小模型与AR眼镜结合的问题。这是你考虑过的事情吗?
李飞飞:
我对新媒体感到非常兴奋。我知道现在还为时过早,就像我们又回到了硅谷一样。
我相信你们中许多人都熬夜购买Vision Pro,我非常兴奋。苹果称之为空间计算,当时我已经考虑空间智能很多年。
我认为,空间计算需要空间智能。目前的形式,可能只是眼镜或耳机,我真的相信眼镜,可能是耳机,眼镜对我来说非常令人兴奋。
边缘计算或小模型也非常令人兴奋,小模型不仅对眼镜与耳机有用,它对边缘计算非常强大,无论是智能设备、机器人,尤其是家用机器人。你不能在后备箱里携带服务器,小模型有很多用处。
我对多模态模型与智能眼镜,在劳动力发展方面可能发挥的作用非常感兴趣。我们没有足够的电工,你可以想象耳塞、AI与智能眼镜,能够提供某种及时培训,作为学徒计划的一部分,提供足够的培训。
汤姆·哈利尔:
我们能做什么?研究界能做什么?公司能做些什么来解决除英语以外的其他语言代表性不足的问题?
李飞飞:
这是一个很好的问题,这涉及到数据偏见与所有这些。
首先,我确实认为,每个国家都应该有公共部门在AI方面的投资,这本身与当地文化、当地语言有关。
这个角度看,个人研究人员的关注很重要,但能够部署大量资源的政府与大型组织也应该关注这一点。
英语确实占主导地位,我们应该意识到这一点,这又回到我关于公共部门投资的观点。
即使在这个国家,我相信我们也有出色的研究人员与学生在思考其他语言,现在他们缺乏数据集与计算资源,我们需要解决这个问题。
汤姆·哈利尔:
观众提出一些哲学问题。我想知道,你是否可以谈谈你为吸引斯坦福人文与社会科学人才而做出的努力。作为一名计算机科学家,他们能够提供哪些让你感兴趣的见解?
李飞飞:
这是我过去5年,建立与共同运营这个研究所最有趣的部分,真正影响了整个校园。
斯坦福大学有大约8所学院,从法学院、商学院、医学院,到现在可持续发展学院、人文与自然科学学院、工程学院,与同事交谈,接触校园里的学生、研究人员与学者,非常有趣与富有启发性。
例如,与人文学科的同事交谈,确实开阔我对人类表达与创造力的理解。
汤姆·哈利尔:
我们如何看待AI与具有深度创造力人的关系?尤其是当ChatGPT与Sora问世时,从好莱坞的编剧罢工,到对声音、艺术家、个人版权的关注,再到走在拥抱这一工具前沿的艺术家,这一切都显得非常复杂。
我没有受过正规教育,甚至无法完全理解这些复杂性,但他们教会我如何思考。我确实学到一件事,再次与在座各位交谈,可能是非常技术性的。
我认为技术人员倾听,并接触人文主义者与社会科学家非常重要。在你工作环境中,这可能涉及法律、产品、营销等许多不同的功能。技术不是存在真空中的,需要复杂的人类努力,才能使技术变得仁慈与善良。带着谦卑与尊重的态度,给予对方应有的尊严,是我们能做的最根本的事情,以建立这些桥梁。
你认为我们在可解释与可解读的AI等领域取得进展,有多重要?
我认为总的来说,这很重要。同样,我们必须进行一些细微的探讨。例如,即使是可解释性,也具有不同的层次。
例如,每个人都知道泰诺可以缓解发烧与头痛。如果让我解释泰诺分子途径,即使在今天,科学家也不知道所有细节,你永远不会说泰诺是一种无法解释的药物。这是围绕药物开发、监管措施、批准过程有一个完整的系统,这个系统有足够的解释,让你或大多数公众信服并感到信任。
另一种可解释性是,例如,你从拉斐特开车到山景城,谷歌地图会给你选择。这条路线需要付费,但快4分钟;这条路线风景优美。这并没有向你解释从A点到B点的算法,作为人类用户,你会觉得你的选择,有足够的可解释性。
再说回医学,我们这些不是医生的人,几乎都不了解治疗。你的医生用某种人类语言向你解释这种治疗是什么。
我用这个例子来与你分享,思考案例与用例非常重要,思考可解释性的定义也同样重要。特定用例的特定定义,确实需要匹配。有时我们不需要机械分子通路级别的可解释性,有时我们需要不同层次的可解释性。
回答你的问题,这很重要,但这取决于具体的用例,它在不同的情况下,有不同的重要性。
汤姆·哈利尔:
我们有很多观众想了解你为世界实验室制定的商业计划的细节,我们会跳过这些问题,他们是观众席中的风投。
有一个问题是,你提到除了研究AI,还研究神经科学。有些人对这个问题很感兴趣,AI能从神经科学中学到什么?
卷积神经网络至少在某种程度上,受到人类视觉系统工作方式的启发。
人们研究过多巴胺奖励回路,这是强化学习的灵感来源。
你认为神经科学与AI之间,在其他领域有潜在合作吗?
李飞飞:
大自然已经解决低功耗计算的一些问题,我们大脑只使用20瓦。
当我们成立斯坦福HAI时,三大研究支柱之一就是神经科学。
对我来说,神经科学与AI之间的跨学科合作,是我们领域发展的基础,也是两个领域未来发展的基础。
我非常幸运能够与Surya Ganguly、Mike Frank、Noah Goodman这样的同事一起工作。斯坦福大学的许多同事,都处于这项跨学科研究的前沿。
例如,幼儿的发展,在早期,孩子们会进行大量好奇心驱动的学习。这如何转化为AI系统?这是一个灵感。
我们还知道,反向传播是对我们大脑中两个神经元之间发生事情的一种非常简单的翻译。
除了突触连接外,还有许多树突连接与大脑有深厚的联系。
我们有非常电气、化学与非常微妙的东西,今天的机器学习算法还没有结合这些复杂、新颖、有趣的突触与神经元通讯渠道。
另一方面,我们神经科学家同事,无论他们使用动物模型还是细胞模型,都在收集大量数据,使用这些数据进行研究。
这就是为什么机器学习或AI,是一种帮助他们发现科学的迷人方式。
最后,但并非最不重要的一点是,即使是我的实验室,我们现在也正在与心理学家合作。使用来自人类的非侵入性电脑电波来驱动机器人,这令人着迷,这是一种完全非侵入性的方式。关键在于,这两个领域有很多交叉融合,对我来说,这是跨学科研究最令人兴奋的领域之一。
博物馆CEO Daniel:
我们有足够的问题,让你在这里待到10点,请与我一起感谢飞飞的精彩采访。谢谢。记住,我看到的世界。这是肯定的。非常感谢你们。再次,这是一个很棒的交流,我个人有很多收获。
汤姆,你在政府中为这些事情做了很多工作。如果没有公众支持,我们就会不知所措。在这个阶段,很多事情都与社会影响有关。
你要找的人,第四个人,出席达特茅斯会议的是纳撒尼尔·罗切斯特Nathaniel
Rochester,当时他在IBM工作。
我想告诉所有最近没有参观过展览的人,楼下有一台霍勒里斯机器,这是赫尔曼·霍勒里斯Herman Hollerith在解决美国面临的一个问题后建造的机器。
政府曾试图将1890年的人口普查编纂成法典,人口增长导致人口增加,采用的技术无法及时进行人口普查。
通过公众号召与私人倡议的结合,他发明一种基于打孔卡的机器,这种机器是为工业革命时期的提花织机设计与制造的,用于存储所有这些织物与窗帘的图案。
我们回到话题,无论是DARPA的资助,还是其他什么,都需要社会对此呼吁。如果不是现在,我不知道什么时候。你在台上为大家阐述了一些很棒的想法,我想再次感谢你们两位。
李飞飞任CEO,空间智能公司World
Labs正式亮相,全明星阵容曝光
World Labs创始团队中,有ImageNet、NeRF、Style
Transfer与Gaussian Splats作者在列。
本周五,一个重磅消息引爆了AI圈:斯坦福大学计算机科学家李飞飞正式宣布创办AI初创公司World Labs,旨在向AI系统传授有关物理现实的深入知识。
李飞飞说道:在AI领域中,真正难以解决的问题是什么?我的答案是空间智能,这项技术可以赋能与实现创作、设计、学习、AR/VR、机器人等领域的无数可能用例。
李飞飞与3位联合创始人Justin Johnson、Christoph Lassner、Ben Mildenhall,一支世界级图像技术团队共同合作成立实验室,致力解决大自然花费5亿年才解决的超级难题。
当前的生成式AI是基于语言,李飞飞看到一个前沿领域,系统利用物理、逻辑与物理现实的丰富细节,构建完整的世界。
2024年5月,李飞飞创业的消息首次
曝光
。可能还需要1年时间才能推出产品,World Labs已收获多达2.3亿美元投资,这家新兴初创公司估值为10亿美元。
World Labs探索方向,是李飞飞研究的进一步延伸。2007年起,李飞飞等人基于超前的眼光创建ImageNet,帮助AI扭转局面,ImageNet是定制的数字图像数据库,测量图片类应用运行准度、效率的行业标杆,它催生出一系列先进的神经网络。
李飞飞认为,如果AI要创造现实世界,无论是现实的模拟,还是完全想象的宇宙,今天的深度学习模型也需要类似的推动。
李飞飞介绍道:计算机的物理世界,是通过摄像机看到,计算机大脑位于摄像机后面。将愿景转化为推理、生成与最终的交互,需要理解物理结构、物理世界的物理动力学,这项技术被称为空间智能。
World Labs的描述,是空间智能公司,它的未来将决定空间智能是否会引发一场革命。
多年来,李飞飞一直对空间智能有着执着追求。当大家都在为ChatGPT疯狂时,她与学生Justin Johnson在电话里兴奋讨论AI的下一次迭代。
Johnson现为密歇根大学助理教授,他表示未来10年将是创造全新内容的时代,这些内容会将计算机视觉、深度学习与AI,从互联网世界带入真实的空间与时间。
在与虚拟网络先驱Martin Casado共进晚餐后,李飞飞决定在2023年创办一家公司。Casado如今是A16z合伙人,这家风投以对AI近乎狂热的推崇,声名远扬。
组建团队时,Johnson作为联合创始人加入。Casado还推荐Christoph Lassner与Ben Mildenhall。
Christoph Lassner曾在亚马逊、Meta的Reality Labs与Epic Games工作,是渲染方案Pulsar提出者。
Ben Mildenhall创造了一项强大的技术神经辐射场NeRF,他离开谷歌的高级研究科学家职位,加入新团队。
World Labs
四位创始人,李飞飞、
Justin Johnson
、
Christoph Lassner
、
Ben Mildenhall
最近,具身智能正在升温,使用大型世界模型进行训练,或许可以赋予机器人世界感。这确实在World Labs计划之中,成型需要一段时间。
在人们预测中,第一阶段,是构建对三维性、物理性、空间与时间概念有深刻理解的AI模型。
如果这一愿景得以实现,大型世界模型将有助于改进自动驾驶汽车、自动化工厂,甚至可能推动人性机器人的发展。
前路漫漫,路途上困难重重,World Labs承诺会在2025年推出产品。
面对外媒连线记者提问World Labs将如何盈利时,创始人李飞飞回应,现在只是刚起步,有很多边界需要突破,还有许多未知的问题需要解决,我们是全球最优秀的团队,能够解决这些未知问题。
Casado
给出更具体的解释,他指出,像ChatGPT或Anthropic的Claude一样,模型本身就可以作为产品,作为供他人直接使用的平台,或者托管其他应用程序的平台,客户可能包括游戏公司或电影制片厂。
World Labs
不是唯一一家涉足物理AI的公司,英伟达CEO黄仁勋在2024年GTC大会上曾表示,为通用人形机器人构建基础模型,是当今AI领域最令人兴奋的问题之一。
Casado坚持认为,World Labs雄心、人才、愿景是独一无二的,我已经做投资快10年,这是我遇到过最强的团队,没有之一。
风投支持自己投资很常见,Casado不仅是投入资金,自从成为投资人以来,他首次作为兼职团队成员,每周花1天时间在公司里。
其他投资公司纷纷入局,包括Radical Ventures、NEA,值得关注的是还有英伟达风险投资部门。
还有一长串明星级别的天使投资人,阵容包括Marc Benioff、Reid Hoffman、Jeff Dean、Eric Schmidt、Ron Conway、Geoff Hinton。
李飞飞宣布成立创业公司后,很多AI领域知名学者纷纷发来祝贺,也有很多是她的学生。
OpenAI创始成员、前特斯拉AI高级总监Andrej Karpathy表示:我在攻读博士学位期间与李飞飞与Justin Johnson共度很长一段时间。我非常怀念这段时光,李飞飞是我导师,也是我们无畏的领导者,Justin与我一起撰写论文,我们三人共同开发CS231n课程的第一个版本。World Labs团队是顶级的,我很高兴看到他们采用当今前沿研究,并将AI扩展到3D领域。
英伟达资深研究科学家、AI智能体项目负责人Jim Fan说道:李飞飞对具身智能的看法,极大影响我博士课程与研究品味,空间智能是计算机视觉与具身智能体的下一个前沿。
World Labs目标会成为AI的下一个大方向,我们还需要等待。
从一个角度看,World Labs的承诺,与此前热炒过的词汇,元宇宙有些相似。不过World Labs创始人认为,那场短暂的热潮来得太早,只是基于一些有前景的硬件,缺乏真正的互动内容,他们暗示,世界模型或许能够解决这一问题。
另一方面,大模型技术爆发后,大量新势力车企已经开始把自动驾驶技术方向转向世界模型与端到端方案,探索具身智能的机器人创业公司也成批出现。
越来越多的实践正在告诉我们,新方法已经展现出跨代优势。
科技说:马斯克、贝索斯、拉里·佩奇/谢尔盖·布林、扎克伯格、黄仁勋、Vitalik Buterin、Brian Armstorng、Jack Dorsey、孙正义、华为、马化腾、张小龙、张一鸣、王兴等
投资说:巴菲特、芒格、Baillie Giffrod、霍华德·马克斯、彼得·蒂尔、马克·安德森、凯瑟琳·伍德等
元宇宙说:Meta/Facebk、苹果、微软、英伟达、迪士尼、腾讯、字节跳动、EpicGames、Roblox、哔哩哔哩/B站等
星际说:中国国家航天局、NASA、历年国际宇航大会,SpaceX、Starlink、蓝色起源、维珍银河等
消费说:亚马逊、沃尔玛、阿里、京东、拼多多、美团、东方甄选等
每个系列聚焦各领域全球顶尖高手、产业领军人物,搜集整理他们的致股东信、公开演讲/交流、媒体采访等一手信息,一起学习经典,汲取思想养分,做时间的朋友,做长期主义者。
六合年度报告全库会员,欢迎扫描识别下方图中二维码或点击文末“阅读原文”购买
智能时代专题,欢迎扫描识别下方图中二维码或点击文末“阅读原文”购买
智能时代专题第二季,欢迎扫描识别下方图中二维码或点击文末“阅读原文”购买
智能时代专题第一季,欢迎扫描识别下方图中二维码或点击文末“阅读原文”购买
六合商业研选付费专题报告,欢迎扫描识别下方图中二维码或点击文末“阅读原文”购买
元宇宙专题,欢迎扫描识别下方图中二维码或点击文末“阅读原文”购买
头号玩家第二季,欢迎扫描识别下方图中二维码或点击文末“阅读原文”购买
头号玩家第一季,欢迎扫描识别下方图中二维码或点击文末“阅读原文”购买
智能电动汽车专题,欢迎扫描识别下方图中二维码或点击文末“阅读原文”购买
【智能时代】现象级游戏《黑神话:悟空》的思考,游戏二元属性,文化与科技
【智能时代】自动驾驶:汽车iPhone时刻,中国三大流派演化形成中
诸神之战:美国科技巨头,从春秋五霸进入战国七雄|GBAT 2023 大湾区智能时代产业峰会
人类未来文明三部曲之二:智能时代专题预售开启,奇点临近,未来已来
九宇资本赵宇杰:智能时代思考,
认知思维,存在原生、降维、升维三波认知红利
九宇资本赵宇杰:智能时代思考,以史为鉴,科技浪潮,从互联网到AI
九宇资本赵宇杰:智能时代思考,宇宙视角,从碳基生物,到硅基智能体
人类未来文明三部曲之一:元宇宙专题预售开启,59期45万字
九宇资本赵宇杰:1.5万字头号玩家年度思考集,科技创新,无尽前沿
九宇资本赵宇杰:1.5万字智能电动汽车年度思考集,软件定义,重塑一切
【重磅】前沿周报:拥抱科技,洞见未来,70期合集打包送上
【重磅】六合年度报告全库会员正式上线,5年多研究成果系统性交付
【智能电动汽车专题预售】百年汽车产业加速变革,智能电动汽车时代大幕开启
【头号玩家第一季预售】:科技巨头探索未来,头号玩家梯队式崛起
【头号玩家第二季预售】:科技创新带来范式转换,拓展无尽新边疆
【首份付费报告+年度会员】直播电商14万字深度报告:万亿级GMV风口下,巨头混战与合纵连横
【重磅】科技体育系列报告合集上线,“科技+体育”深度融合,全方位变革体育运动
【重磅】365家明星公司,近600篇报告,六合君4年多研究成果全景呈现
九宇资本赵宇杰:CES见闻录,开个脑洞,超级科技巨头将接管一切
【万字长文】九宇资本赵宇杰:5G开启新周期,进入在线世界的大航海时代|GBAT 2019 大湾区5G峰会
九宇资本赵宇杰:抓住电子烟这一巨大的趋势红利,抓住产业变革中的变与不变
【IPO观察】第一季:中芯国际、寒武纪、思摩尔、泡泡玛特、安克创新等11家深度研报合集
【IPO观察】第二季:理想、小鹏、贝壳、蚂蚁、Snowflake、Palantir等12家公司深度研报合集
【IPO观察】第三季:Coinbase、Roblox、快手、雾芯科技等12家公司深度研报合集
【重磅】年度观察2019系列合集:历时3个多月,超20万字近500页,复盘过去,展望未来,洞悉变与不变
【珍藏版】六合宝典:300家明星公司全景扫描,历时3年,210万字超5,000页,重磅推荐
九宇资本赵宇杰:对智能电动汽车产业的碎片化思考
九宇资本赵宇杰:九宫格分析法,语数外教育培训领域的道与术
【2023回乡见闻录】90、00后小伙伴们万字记录,生活回归正轨,春节年味更浓
【2022回乡见闻录】20位90、00后2万字,4国13地,全方位展现国内外疫情防疫、春节氛围、发展现状差异
【2021回乡见闻录】22位90后2万字,就地过年与返乡过年碰撞,展现真实、立体、变革的中国
【2020回乡见闻录】20位90后2万字,特殊的春节,时代的集体记忆
【重磅】22位“90后”2万字回乡见闻录,讲述他们眼中的中国县城、乡镇、农村
六合君3周岁生日,TOP 60篇经典研报重磅推荐
下午茶,互联网世界的三国杀
5G助推AR开启新产业周期,AR眼镜开启专用AR终端时代
新商业基础设施持续丰富完善,赋能新品牌、新模式、新产品崛起,打造新型多元生活方式
【重磅】中国新经济龙头,赴港赴美上市报告合辑20篇
知识服务+付费+音频,开启内容生产新的产业级机遇,知识经济10年千亿级市场规模可期
从APP Store畅销榜4年更替,看内容付费崛起
新三板破万思考:新三板日交易量10年100倍?
九宇资本赵宇杰:科技改变消费,让生活更美好|2017 GNEC 新经济新消费峰会
九宇资本赵宇杰:创业时代的时间法则,开发用户平行时间|2016 GNEC 新经济新智能峰会
九宇资本赵宇杰:互联网引领新经济,内容创业连接新生态
|2016 GNEC 新经济新营销峰会