就在DeepSeek以低成本模型搅动全球AI格局之际,OpenAI CEO Sam Altman与软银创始人孙正义在东京进行了一场重磅对话。
在昨天这场2月3日的对话中,Altman首次公开回应了DeepSeek带来的挑战,并透露了OpenAI的技术路线选择。
一向高调的孙正义更是直言不讳地表示,未来几年AI算力投入将呈"10×10×10"的指数级增长,直指当前以DeepSeek为代表的"低成本路线"。
Sam Altma:
是的,而且整个世界今后将需要大量的算力(compute)。正如我前说的,我们可以让小模型也完成一些令人难以置信的任务,但如果要真正推进智能的前沿,就需要海量的计算力。而在那个前沿,会产生最大的价值。所以,我们需要大量计算能力来训练这些模型,而人们显然也会需要大量的算力来运行这些模型。能够最终大规模地去做这件事,真是太好了。我对此感觉非常好,真的很不错。
Sam Altma:
对,没错,‘越多越好’。这并不是说计算力有一个固定的上限,而是越多越好。更多的算力当然就能带来更强大的模型,对吧?有些人说‘你也可以用小模型来做压缩’,但那真的只是小打小闹。我觉得人们还没真正理解回报在多大程度上是呈指数级增长的。当然,成本也是指数级增加,但我认为收益增长得更快。当我们要做最智能的模型时,就需要最大的计算机。
Sam Altma:
我觉得在‘智能’(intelligence)这件事情上,也会发生同样的情况。有人会问:‘AI到底要多聪明才能够?’其实答案是:‘它越聪明越好。’人们会大量使用它,会生成海量视频,解决非常困难的问题,然后世界上的一切都将变得非常智能。
孙正义:
现在,你们的模型实际上提高得很快,对吧?就像一年能提升10倍那种?你们衡量的标准是什么?
Sam Altma:
我们并没有一个精准的科学量化方法,但就一种‘直觉’或‘精神层面’的感觉来说,我们每年大概能往IQ的标准差方向提升一个单位。此外,每年上一代模型的计算成本都会下降大约10倍。芯片成本的下降会带来更高的性价比——同样的预算,我们就能买到多出10倍的芯片,而且算法本身也变得更有效率,所以这些因素是会相互叠加的。这个进步速度很容易被人们视作理所当然。2018年和2019年,我们有了GPT-1和GPT-2,当时大家看了也没觉得多震撼。GPT-3推出时,才第一次让一部分人产生注意,但其实GPT-3也很有限。如果你现在回去用用GPT-3,会觉得就像进入一家老式计算机博物馆,看着一台Xerox Alto(施乐Alto),它已经有几十年的历史了。你能看到它确实实现了一些功能,也有点现代计算机的影子,但那毕竟是50年前的东西,现在看就像远古一样。GPT-3其实也只是几年前的产品,可我们现在再看它,就感觉有点像个笑话。ChatGPT上线才一年多一点的时间(2022年11月底),GPT-4是2023年3月才发布的。如果你看看这个进步的速度:模型的能力提升得有多快、成本又降得有多快,如果我们能一直保持在这个曲线上,未来就会非常令人惊艳。
Sam Altma:
完全没错。现在光靠一个文本框,就已经给人们带来了很大的价值,但我们的世界可不只是一个文本框。所以我们一定会加入更多方式,比如语音、视觉等等。就好比对着这颗‘水晶球’说话一样。你只要开口,AI就能看见你,看见你的脸,理解你的语调。就像我们彼此交流,它也能通过语音、表情、周围环境自行捕捉信息,然后与我们对话。
Sam Altma:
是的,我也曾非常担心延迟。但就算你今天用我们的语音功能,感觉就像跟一个真人讲话一样,回复很快、效果很棒。我想我们可以解决这个问题。回想几个月前,其实还经常有延迟,但现在,甚至昨天晚上我还在用的时候,就觉得‘哇,它反应好快!’所以对我来说,延迟已经做到了相当不错的水平。现在大概在100毫秒左右,也许稍微高一点,但的确很快。100到200毫秒,其实和人类对话的间隔差不多——人类之间的对话反应大概也是200毫秒吧?所以在100到200毫秒之间的交互几乎可以和人类对话同步了,你还可以中途打断,这才是关键。因为人类也会中途插话。这一切都已成为现实,所以你问我对把模型训练好后在日本实时提供服务有没有信心?答案是肯定的。
孙正义:
就算模型是在美国训练,但在日本有Stargate中心,你觉得实时响应也没问题?
Sam Altma:
是的,肯定要把一些非常低延迟的用例放在离用户更近的地方。但正如你所说,我们可以在美国进行训练,也可以在美国处理很多‘思考’(深度推理)的过程。只是在某些应用场景下,为了极低的延迟,会需要在边缘节点去部署模型。
Sam Altma:
我们会有一些通用型的代理,供消费者使用。它们可以做很多强大的事情,比如我们刚刚看到的那种深度研究、浏览网络之类的操作。但是,对于企业或组织来说,或者说对所有人来说,理想的代理应该能像公司内部的一名员工那样,拥有同样的背景信息、权限和能力。也就是说,你需要把公司所有的系统、所有的知识库都连接起来,让代理访问企业内部的代码,理解公司是如何运作的。这对每家企业来说,都会需要大量的定制化工作。可是一旦你完成了这项工作,就能想象那会带来什么样的变化。举个例子:如果有人把AI代理整合到了软银的业务里,而同时还有一家虚构的竞争对手没有这样做,那么软银就能做得更多、更快、更好。一旦将AI真正融合到公司的工作流程中,拥有它所带来的所有强大功能,就不只是做做深度研究或在网上浏览、编写通用代码那么简单,而是和公司各系统深度集成在一起。这将会产生巨大的威力。
Sam Altma:
毫无疑问会的。我觉得这正是那种关键性的时刻。你提到了‘剑’——我自己就收集一些古老的技术制品。在青铜时代刚开始时,我手里有一把那个时期的剑。当时他们不仅能锻造剑刃,还能铸造金属的剑柄,然后把金属柄和剑刃连在一起。这样就可以像挥砍那样去使用,而不是像之前只能用木柄插在剑刃上的版本,一挥就会断,所以只能用来捅。这是技术在一瞬间赋予了人们决定性的优势。在短短几十年里,这改变了整个欧洲。我觉得AI就是这样一种技术。那些没有充分整合AI的公司,将会很难跟已经整合AI的公司竞争。
Sam Altma:
是,它确实会节省成本,但那并不是最令人兴奋的部分。最令人兴奋的是,我们能做得更多、能实现更多。让人类摆脱重复性工作,去做更有雄心、更高层次的任务。每次技术革命出现时,人们都会担心:‘那工作怎么办?’可随后我们总能找到新的事情去做,这非常好。人们会在更高水准上发挥,也会有更高的期望。当然,AI会让很多流程变得更加高效,这对经济有利。但我最兴奋的地方在于:这些系统可以帮助我们创造新的知识——我们自己可能无法独立完成的知识或科学突破。如果科学进步速度能显著加快,让我们在一年里取得过去十年才能取得的进展;接下来的一年,又能取得过去一个世纪才能取得的进展,那将极大地影响人们的生活质量和经济发展。这可不仅仅是让什么东西变得‘更便宜’而已,而是我们以前根本做不到的事情。我们没有这样的工具就不够聪明去办到。”
Sam Altma:
我认为,它跟人类的过程很像。如果你要解决一个你没解决过的问题,就会先想出一堆主意,然后留意这些想法之间的关联,或者从已有知识出发看看哪些能用,哪些行不通。比如你会发现:‘这个不行,这个不行,这个还挺有意思,我再往前走一下……哎,也不行……哦,这个方向不错,我再继续推进。’一旦你觉得‘哦,可以往这里、这里、这里走’,这看起来很有前途,就会沿着那个方向走得更远。对于人类来说,创造力过程看起来不一定总是这样,但在自我感知背后,我猜也差不多是这么运转:从已有的东西上做大量微小的改动,然后逐渐构建出更具潜力的想法。我认为我们可以用AI来实现这样的过程。
孙正义:
所以推理是第一步,对吧?可能会是三步、十步、甚至一百步的推理。然后人类在创新时,还会尝试用不同的角度去思考,去做探索。这就是你说的‘探索(exploring)’的概念。我过去12个月里提交了1800项专利(我理解是一种表达夸张的方式),在我的脑海中,我不断去发散、强迫自己从右脑去思考,努力在各个方面进行尝试。我觉得AI‘代理式’的推理也可以通过一种机制去强迫自己做各种不同的尝试——‘探索’,这正是通往创新者的关键之处。它可以进行成千上万、乃至上亿次尝试和错误(Trial and Error),然后偶尔就会碰到正确答案,这就是发明。
Sam Altma:
正是如此,这就是‘创新者’大概会运转的方式。对,很快就能试一试,非常好。不过我也不能说太多,毕竟有一些开发上的秘密。
Sam Altma:
这是我最期待的应用领域之一。想想我们如何为地球上所有人提供高质量的医疗服务,想想我们或许可以治愈或改善很多疾病,也许有一天甚至能治好所有疾病。我觉得这触手可及。每个人可能都经历过某种情境,如果当时有这样的技术,就能对自己或家人带来很大帮助。我相信AI在这方面的成就会非常显著。
孙正义:
那再说到机器人。你也喜欢机器人,我也喜欢机器人。这应该是你的一个心头好,对吧?
Sam Altma:
我和所有人一样,从很久以前就想要有机器人。但一直以来都觉得很难。现在AI部分(也就是‘大脑’)终于在不断进步,我们早就能造出‘躯体’,但关键一直是难在‘大脑’。我觉得很快就能实现。所以,再过几年,我们或许可以看到性能非常出色的类人机器人,以及各种其他类型的机器人——这也会改变世界。