近日, Meta CEO Mark Zuckerberg 与科技创作者 Robin Kallaway 进行了一场深度对话,讨论了未来十年的技术发展,尤其是智能眼镜、神经腕带和 AI 技术在创作者和小企业中的应用。
Zuckerberg 详细讨论了智能眼镜的未来发展方向,认为其将逐步取代手机成为主要的个人硬件设备。他提到,未来的智能眼镜将分为三种类型:无显示屏的基础型、带有抬头显示的中级型和全息显示的高级型。
他还强调,未来的 AI 技术将不会是单一的,而是多样化的,允许创作者和小企业创建定制化的 AI 。这种多样化的 AI 体验将提升用户互动的丰富性和个性化。
此外,智能眼镜和神经腕带将如何改变人们的互动方式。Zuckerberg 认为,这些技术将使人们在现实世界中保持专注的同时,以更自然和高效的方式获取信息和互动。
Robin Kallaway
Mark,你能谈谈 Meta 在更广泛的 AI 领域的策略吗?因为将会有成千上万的创作者听到这个。他们了解 AI ,了解玩家,玩过一些工具。但我认为听你谈谈会非常有帮助。Meta AI 计划是什么?它如何适应市场?
Mark Zuckerberg
我想说的是,我们的方法与其他公司有很大的不同。你会看到很多公司试图构建一个主要的 AI 供你使用。无论是
Google Gemini
还是 OpenAI ChatGPT。而我们的看法是...我们也会有一个基本的 Meta AI 助手供人们使用。但我们的总体观点是,这不应该只有一个。
我们认为人们希望与许多不同的人和企业互动。需要创建许多不同的 AI 来反映人们不同的兴趣。所以,我们的方法很大一部分是让每个创作者最终也让平台上的每个小企业创建自己的 AI ,以帮助他们与社区和客户互动。
我们认为这将创造一个更加引人入胜的体验,比仅仅使用一个单一的东西更加动态和有用。显然,其中一部分是我们不是自己构建这些东西。我们在构建底层技术。我们希望使我们正在构建的底层模型 Llama 达到世界领先的水平。
我们想全力以赴,试图构建完全通用的智能,建立领先的模型。我对我们的进展非常满意。但同样重要的一部分是为创作者和企业构建工具,使他们能够随着时间的推移创建反映他们自己的 AI ,并创造各种不同的体验。
所以这就是本周 AI Studio 公告的内容。这是一个早期测试,但在实现这一愿景方面是一个令人兴奋的一步。
Robin Kallaway
这正是我想要探讨的内容,因为我认为这种网络视图,也许是单一目的的,也许是多功能的 Agent 结合在一起,为每个创作者和企业定制的。这正是我认为我们未来的发展方向。说在十年后我们会有更多的创作者并不具争议性。而且主流内容会更多地通过创作者流动。
Meta 已经是今天铺设这些轨道的主要一层。但是当你考虑创作者体验的未来是什么样子时,从战术用例的角度来看,未来会是什么样子?有什么事情看起来对你很有趣?
Mark Zuckerberg
首先我完全同意你的观点。如果你看人类历史的更广泛的轨迹,越来越多的人有机会追求自己的创造力和兴趣,而不是做那些他们可能觉得单调乏味或者仅仅为了工作的工作。
基本上,我们越来越多地做自己真正喜欢的事情。很多技术的发展是为了实现这一点,不仅通过提高其他任务的生产力,还通过为人们提供各种新工具。所以,这绝对是未来的一部分,
我们想要构建更多的工具,让更多的人能够,包括那些今天不认为自己是创作者的人,因为每个人在某种程度上都是有创造力的。
就像我看到我的孩子们一样,他们并不认为自己是创作者,但他们肯定在玩乐高时创造了各种不同的东西。这是毕加索的老话,每个孩子都是艺术家,挑战在于长大后还能保持这种状态。
我们要做的一部分是构建允许每个人这样做的工具。那么我看到的趋势是什么?
在社交媒体方面,有几个大的趋势。一个是从基于信息流的媒体转向更个人化的消息互动。
比如,如果你看 Instagram ,私信是系统中增长最快的部分之一。这也是我对创作者工作室和 AI 工作室感到兴奋的部分。
基本上,我们正在使人们能够为自己的 AI 版本创建一个角色,以帮助他们处理社区发送的所有私信。这就是经典的问题,时间不够用。
每个创作者都希望与每一个联系他们的粉丝互动,但你根本没有时间。当然,可能还有更多的人比发送消息的人还多,想与创作者创建的内容互动。但很多人可能根本不会发送消息,因为他们知道创作者不会有时间回复。
问题在于创作者为自己创建的
AI Agent
的质量有多高,这将成为一种艺术形式,会随着时间的推移发展和进步,会变得越来越好。
但对很多人来说,知道他们在与创作者创建的东西互动,这很有意义。虽然可能不如与创作者本人互动好,但对很多人来说,这是不可得的,因为创作者没有足够的时间来回应。所以这是一个重要部分。我们可以深入探讨这个话题。另一个快速增长的领域是短视频。
最近有一个惊人的趋势,从电影和长篇电视节目,到人们一度认为 YouTube 是短视频,因为人们将其与电视和电影相比,但今天与真正的短视频相比,很多 YouTube 视频感觉很长。你在看 YouTube 视频时可能在做多任务,因为它持续了好几分钟。
这种趋势可能会继续下去,因为人们有工具来创建非常吸引人的内容,并使其非常紧凑和精练。这些工具的发展速度会继续下去。人们会使用 AI 来创建和编辑视频。整个过程仍然会有大量的创造力,因为你需要精心打磨你正在构建的东西,就像雕塑一样。
但从根本上说,它会变得更容易获得,内容的质量也会随着人们能够尝试更多不同的想法而提高。所以,这两个大趋势是消息和短视频,这是我目前看到的两个大趋势。
Robin Kallaway
这种杠铃策略,一端是超级原始、未编辑的长篇播客对话,另一端正如你所说的超级精致的短篇故事,似乎吸引力正流向这两端。我想讨论一下 AI 工作室在工具方面的情况。
今天基本上是奠定基础的阶段,这是创作者如何在 Meta 世界中与 AI 互动的基础构建模块。今天是第一块基础工具。你能谈谈你的策略是如何逐步实现的吗?今天发布了什么?为什么你对此感到兴奋?我可以分享我的反馈作为测试。
Mark Zuckerberg
然后我们可以讨论这些战术工具的逐步实施。有几条技术路径是同时进行的。一条是 Llama 的开发,底层模型的调优,这是我们在获得反馈的过程中进行的。这是底层核心基础设施。在此基础上,我们正在创建的所有产品体验和工具,使人们能够创建这些不同的 AI 。
所以,无论是创作者创建一个 AI Agent 版本来与他们的社区互动。
在某个时候,我们还将推出让任何人创建用户生成内容 AI 的功能。所以不一定是你自己创建的,它可以是一个你想要在 Instagram 和其他应用程序上存在并与人们互动的新虚拟角色。
今天我们可能不会详细讨论,但在商业方面,小企业数量不亚于现在的创作者数量。这是一个巨大的机会。
对于任何企业来说,按几个按钮创建一个能够帮助你进行客户支持和电子商务支持的 Agent 版本应该是非常简单的,这将非常强大。
今天我们正在推出第一个测试阶段。我们试图分阶段进行。我们与大约 50 位创作者一起启动,并将逐步推出给一小部分人。然后随着我们调整这一点,可能在接下来的一个月左右,我们会逐步推出,让更多人能够与这些创作者创建的 AI 互动。
也许到 7 月底或 8 月,我们会全面推出。但这将是一个非常有趣的体验,看看人们如何喜欢与这些 AI 互动,以及为创作者构建工具是一个大部分。很想听听你的反馈,你在使用这个工具时有什么感受,哪些地方表现良好,哪些地方需要改进。
Robin Kallaway
我很乐意分享。对我来说,作为一个创作者,我的父母实际上在俄亥俄州经营一个高尔夫球场。他们就是小企业的使用案例,他们有一个 Instagram 账户,收到很多请求,他们像你说的那样,无法应对大量的私信和消息。
我的想法是,这有点像一个光谱,有事实性问题,这些问题大量涌入,我相信你也有这种经历,很难想象,成千上万的事实性问题,比如,你有没有这个链接,或者你做过这个视频吗,或者你的衬衫是从哪里来的?这些都是显而易见的问题,只需要克隆自己来回答。这是这个技术的初步用例的惊人之处。
每个小企业和创作者都会想要这个。然后在光谱的另一端,我一直在玩的更多是那种意见型问题。例如,如果有人问,嘿,如果你是我,你会如何发展你的品牌?这是一个多方面的问题,很难一口气回答。这也是我觉得有趣的地方,观察 AI 在我和我的回应上进行训练并磨练它。
如果我能扩展这些意见性回答,因为作为创作者,我的目标之一就是建立一对一的信任。这是我唯一关心的事情。我已经达到我的能力极限了。所以我想到的一个问题是,事实性的问题很有意义。
每个粉丝都会同意他们只想获得那些信息。但在意见方面,一些粉丝会担心 AI 助手可能会使人与粉丝之间的那种神奇的联系去人性化。所以问题是,你如何去构建这些对创作者无比有用的 AI 工具,同时保持真实性和人性化的联系?
Mark Zuckerberg
所以你提到的意见型问题,更多的是一种艺术形式的体现。也就是说,这些东西的训练过程。
显然,首先是基础的 Llama 模型。但是创作者在设置这些 AI 时,有机会从他们的社交媒体存在和他们想要训练系统的任何其他信息中提取各种信息。
就像你说的,事实性问题相对来说比较清晰,可以理解我们何时做对了,何时没有。而在意见方面,创作者会有更多的意见,关于他们希望 AI 如何表达他们的观点。至于人们知道他们在与 AI 互动的那一点,这是我们的核心设计原则之一。
我们不想让人们以为他们在与创作者本人互动。
我们希望它尽可能高保真地反映创作者的意图,但也会非常清楚地标明这是 AI ,这样就不会有任何混淆。
当你与社区互动时,你可能会觉得可以在表达上更加自由或冒险,或者在某些可能更具风险的表达上更加接近底线,但你可能不希望你的 AI 这样做。
尽管你可以让它基于你的社交媒体内容进行训练,但你可能希望训练它在某些事情上保持更加谨慎,避免涉及某些话题,直到你对它能够准确地反映你的意图有更多的信心。
这些工具非常重要,但这是一种艺术形式,我们在开始时并不知道什么是最具吸引力、最能建立信任的公式。因此,我们希望提供工具,让大家可以试验,看看什么最终效果最好。
Robin Kallaway
我真的很想讨论的是 AI 工作室的未来功能创意。让我给你一个非常酷的例子。当你在观看这个视频片段时,如果有人可以点击你的衬衫或我的帽子或这个灯,并立即有一个 AI 层识别品牌和产品,自动添加到购物车,并自动跟踪返利。这种无形的层次可以真正帮助实现货币化。
显然,由于基础设施原因,每小时有数百万个Reels被创建,今天支持这一点会很困难,但这可能在计划中。还有哪些未来的 AI 工作室功能是我们还没讨论到的,你认为我们在未来三到五年内可以实现的?
Mark Zuckerberg
理解不同物品的功能应该随着时间的推移适用于所有帖子。我们会达到那一点。我们在
Ray-Ban
Meta 眼镜上有这种多模型 AI 的早期版本,你可以说,“嘿 Meta ,看一下这个东西是什么?”它非常准确地告诉你我们在看什么,并能够回答相关问题。
随着 Llama 模型的不断改进以及我们完全推出下一版本,这只会变得更好,这是一个大功能。还有很多类似的事情,能够自动翻译和配音是我对未来非常感兴趣的事情。
讲英语的人常常忽视了世界上很多人不讲英语。能够自动将所有内容翻译成各种语言,并使其对更多人可访问,如果能感觉到真实并像你在说那种语言一样,那将非常强大。
这些是一些非常令人兴奋的想法,但这些不同于 AI 工作室,这是 AI 在内容、内容理解和内容翻译等方面的不同应用。
对于 AI 工作室本身,将会是如何给创作者提供更多工具来调整体验,使其更加有趣和建立信任的一种持续演进。我们还会添加不同的模式。
起初是文本,但随着时间的推移,会有视频、音频,最终能让它成为3D,这样你就可以以全息图的形式出现在某人的客厅里,这将非常酷。
我们专注于元宇宙和所有具象化工作,这也是我们的自然路径,我们试图让创作者能够以更自然的方式与人们互动。
Robin Kallaway
我非常喜欢你提到的这个 Agent 网络的概念,因为我在玩这个的时候,我在想,好吧,这是一级,那二级会是什么?
一个例子是市场研究 Agent ,我试图提出制作什么视频或向社区提供什么产品或课程。
如果我有一个 Agent 可以出去并与 5% 的观众进行一对一对话,挖掘他们的痛点,并自动完成这些事情,那将非常棒。
你把这些小的用例堆叠起来,突然之间就有了一套对创作者非常有价值的 Agent 、 AI 或机器人。
Mark Zuckerberg
这是一个好观点。在商业环境中,这一点更清晰,企业需要客户支持,但更高一级的是能够汇总分析,了解人们需要支持的所有事项,并改进它们。
对于创作者来说,也有类似的版本,比如,我的社区如何喜欢与我的内容互动,不同的反馈是什么,我如何将这些因素纳入我的创作过程或商业模式中。
Robin Kallaway
我非常喜欢讨论未来的所有这些用例。我们都是技术乐观主义者,我相信几乎所有这些技术,从长远来看,都会对人类有净效益。但有一个大问题,我肯定你也经常听到,来自朋友、家人,我也在评论区经常听到。
基本上,很多人对 AI 有很多恐惧和不确定性,主要是因为创意人士和艺术家害怕 AI 可能会取代他们,抢走他们的工作。
我想起我的兄弟,他是一个出色的动画设计师,但他非常担心。他担心他所受的教育和培训,是否会因此而变得毫无意义。
对这一群体而言,听到像你这样的人分享关于 AI 驱动的未来的原始想法会非常有益。这对他们来说意味着什么?你能为他们提供一些心态或框架吗?
Mark Zuckerberg
我同意你所说的,未来将会有比现在更多的创意工作。你可以看一下人类的轨迹,大多数人过去是农民,但现在我们不需要那么多人从事农业了。
人们可以追求更有创意的事情。随着技术的发展,我们使用的工具也会发展。成为一个有才华的人,关键在于与这些工具保持同步。
但从根本上说,未来会有更多的创意机会,伴随着更强大的工具,让人们能够做到这一点。退一步说,我确实认为有一点让我感到困惑的是,行业中的一些人推动的叙事是,他们认为会有一个万能的 AI ,可以做所有事情。
我不认为事情会这样发展。我理解,如果你在某个 AI 实验室,你可能希望自己正在做的事情非常重要,然后你就会觉得,好的,我们在为未来构建唯一的东西。但现实情况并非如此。
这不像人们手机上的应用只有一个,人们只想从一个创作者那里获得所有内容。人们重视多样性,这创造了丰富性和我们在生活中学习和进步的感觉,体验不同种类的事物。
因此,我非常相信,
未来不会只有一个 AI ,而是会有很多不同的 AI ,让很多不同的人能够创造不同的东西。
这也是我如此信奉开源的部分原因。
我不认为 AI 技术应该被囤积,只有一家公司可以使用它来构建他们的中央产品。如果你相信最好的体验和最好的未来会有很多不同的 AI 和很多不同的体验,你就希望它能在各种方式中传播出去。
这部分是为创作者和平台用户构建工具,使他们能够创建自己的 AI ,就像UGC类型的 AI 情况,还有所有的商业内容。
另一部分是开源,这样其他公司也可以创建不同的东西,人们可以自己玩弄和修改。所以,我有一个非常深刻的世界观。当技术行业的人谈论构建这个唯一的 AI 时,我感到非常不舒服。
他们好像认为自己在创造上帝,但这不是我们在做的事情。我不认为事情会这样发展。显然,我们将在十年后使用与今天不同的工具,就像我们今天使用的工具与十年前不同一样。但这回到了你的主要观点,即未来将会有比今天更多的创意工作。
Robin Kallaway
我想到了数码相机。当时有很多摄影师,然后数码相机出现了,摄影的品味仍然很重要。他们只是得到了一个更好的工具,可能用于不同的用例。我非常同意你所说的,很多公司试图构建这种封闭的一体化平台,这对我来说也是一种打击,这比有益更具破坏性。
Mark Zuckerberg
这不会在世界上创造更多的价值。这是一个有点奇怪的意识形态,但从我的角度来看,我也认为这不是为人们创造最佳体验的方式。你想解锁并释放尽可能多的人来尝试不同的事情,这就是文化的本质。这不是一群人垄断一切,而是你希望有各种不同的想法在那里。
Robin Kallaway
完全同意。我想回到你之前提到的Ray-Ban Meta 。我使用它时感到非常震惊。音频、摄像头质量,以及多模型 AI 的结合,远远超出了我的预期。
我听过你分享的一个框架,即你认为像智能眼镜这样的设备可能会成为下一代的手机,而像 Quest 3 VR 这样的设备可能会成为下一代的计算机和电视。这对我来说很有意义。
作为一个产品构建者,我很好奇,Ray-Ban Meta 或智能眼镜,还需要什么才能让数十亿人更喜欢使用眼镜而不是手机作为主要硬件设备?
Mark Zuckerberg
这是个有趣的问题。如果你几年前甚至一年半前问我,我会说我们需要达到全息AR的水平,才能让这成为人们使用的主要平台。我们正在努力解决这个问题。我们从两个不同的方向攻击这个问题。
对于Ray-Ban Meta ,我们看了一下,问自己,如果我们只采用今天最好的眼镜形式因素,我们能在不影响形式因素、重量等方面的情况下,塞进多少技术。这就是我们得到的Ray-Ban Meta 。
但我们也从另一个角度出发,想要创造全息 AR。这仍然需要是眼镜,不是头戴设备,但可能会有稍厚的框架,因为你要塞入更多的技术。
这不是我们拥有的原型版本,但我很兴奋,我们越来越接近展示它了。这不是最时尚的东西,但它是好的。它无疑是眼镜,而不是头戴设备。
随着时间的推移,这两条路径会逐渐融合。我以前认为我们需要全息来实现存在感,但 AI 取得了如此大的飞跃,即使是一个简单的产品也会更快地吸引人。
Ray-Ban Meta 产品的需求比我们预期的高得多,一方面,你喜欢看到这种情况,另一方面,我们没有生产足够的产品,这有点令人沮丧。
它在大多数款式中已经售罄,你仍然可以买到基本的黑色款,但很多人想要的其他款式已经售罄。我们正在加速生产和工厂生产线,以制造更多产品。
我现在的观点是,会有很多这样的产品。
我实际上认为你可以用摄像头、麦克风和扬声器以及多模态 AI 创造一个很棒的体验,即使眼镜上没有任何显示器。事实上,有趣的是,显示器本身可能不会立即适合所有人,因为它增加了眼镜的重量,使它们变得更贵。
你可以以 300 美元的价格买到 Ray-Ban Meta ,但如果你添加全息显示器,那将显著增加成本,即使在可能实现的情况下,我们也能将其置于我们想要的形式因素中。
我仍然认为,对于能负担得起更昂贵设备且不介意其稍重的人,他们可能会想要全息功能。十年后,我们会得到真正小型的全息设备,那将非常棒。
但在近期内,我实际上认为很多人会更喜欢 Ray-Ban Meta 这样的产品。当然,我们会继续让这种形式因素随着时间的推移变得越来越小。所以这是一个非常令人兴奋的演变。
1)无显:
一种是没有显示器的眼镜,只能进行 AI 操作,捕捉内容,可以听有声书、音乐、接电话等;
2)非全息:
另一种是非全息显示器,意思是它不会像全息图那样覆盖你的整个视野。但它可能会有一点抬头显示,这会带来很多有趣的用例。你可以收到通知,发送消息,与 AI 对话,回答问题,不仅能听到,还能看到,这提供了更高的带宽。这会很令人兴奋,有很多小屏幕的用处,即使只是一个小小的抬头显示器。
3)全息:
然后会有最顶级的版本,即全视野的全息显示器,我们在未来的对话中,你是坐在我客厅沙发上的全息图,或者你在这里,不仅仅是视频通话,不仅仅是屏幕上的全息图。
我们可以互动,你想玩牌,我们可以有一副全息图的牌。我们可以互动,乱搞同样的东西,你想一起创作艺术或内容,或者在白板上画画,都可以做这些事情。这将非常疯狂,这仍然是最终的方向。但我现在更乐观的是,即使在我们到达那里之前,这也将是一个大事件。
Robin Kallaway
那就像托尼·斯塔克的眼镜是最后一个用例。我听说过你提到过一个腕带,可以捕捉到皮下神经信号,我觉得这也很酷。
Mark Zuckerberg
那是什么样子?是神经腕带,神经接口腕带。当人们听到神经接口时,我想他们的第一个反应是,哦,这一定是植入你大脑的东西。但大多数人不想要什么东西植入他们的大脑。
我同意。但你的大脑通过神经系统向你的身体发送信号。那就是你如何激活所有肌肉的方式。
事实证明,有很多不同的路径在你身体的正常运作中并没有被使用。所以你可以有一个腕带,基本上训练它去捕捉你大脑通过不同路径传递的信号和方式,以不同于你通常的方式移动你的手。
最终你会达到这样一个程度,即使不明显移动你的手,你也能通过这个神经接口进行交流。所以它会从一些简单的动作开始。但在未来几年,你将能够用它打字,做各种事情,控制光标。这将是非常疯狂的。
所以,与眼镜结合将会带来一系列非常惊人的用例。即使只是一个抬头显示器版本或者甚至没有显示器。你基本上可以坐在那里,无论你在哪里,你都可以给某人或 AI 发送消息。
再一次,这不仅仅适用于 Meta ,随着时间的推移,它将适用于所有不同的 AI ,所有创作者的 AI ,任何你想互动的人。你可以坐在那里,默默地、谨慎地发送消息,然后你可以在耳边听到回答,或者如果你有显示器版本,可以看到小小的文字弹出。我觉得这会非常疯狂。
对我来说,最好的一点是,我更喜欢与人面对面交流。但对我来说,Zoom 上小组对话的最好部分之一是你可以有整个背后频道,在主要会议或对话进行的同时,你还可以与一部分人聊天,有时在会议中我有一个问题想问某人,但我不想在所有人面前问。所以我只能等到会议结束。
但在数字会议中,你可以在会议进行时给某人发信息,比如在 WhatsApp 上发消息。在面对面互动时也能通过眼镜做到这一点会很棒。你可以与人互动,但也可以在对话期间获取信息,使事情变得更加高效,这将非常强大。
Robin Kallaway
我以前低估了的一点是,手机会打破你的专注。当你在用手机时,你就完全在手机里,而不是在外界。但一旦你戴上眼镜,甚至没有抬头显示器,但有了它也不会分散你的注意力。你会非常专注。你可以在现实世界中,同时以混合的方式获取信息。这是一个非常有趣的平衡,有腕带和眼镜的结合。
Mark Zuckerberg
就像你说的,你问什么时候这会取代手机。
在技术史上,新平台通常不会完全使人们停止使用旧的东西,只是你会用得更少。
很多人今天在手机上做的事情,以前会在电脑上做,因为更方便。你不再那么频繁地打开电脑,不去书桌前,你只是直接在手机上完成。
即使我坐在书桌前,我也会在手机上做很多以前十到十五年前会在电脑上做的事情。眼镜也会这样发展。不是说我们会停止使用手机,只是它会更多地待在你的口袋里。你会在需要时拿出来,但越来越多的人会说,嘿,我可以用眼镜拍照,我可以向 AI 提问,或者发送消息,这样更方便。