专栏名称: 机器之心
专业的人工智能媒体和产业服务平台
目录
相关文章推荐
人工智能那点事  ·  刷医保可买华为手表?有药店超500人预约!各方回应 ·  2 天前  
爱可可-爱生活  ·  【[138星]Unlock-DeepSeek ... ·  2 天前  
宝玉xp  ·  这是一篇相当棒的科普文章,作者以 ... ·  3 天前  
宝玉xp  ·  这篇刊登在自然杂志对 Deep ... ·  3 天前  
爱可可-爱生活  ·  通俗版解读 查看图片-20250207090641 ·  3 天前  
51好读  ›  专栏  ›  机器之心

推理和RL加速GPT-5.5到来?奥特曼公开GPT-4.5已就绪,年底发布全自主智能体

机器之心  · 公众号  · AI  · 2025-02-09 13:03

正文

机器之心报道

编辑:佳琪、蛋酱


DeepSeek 以低成本模型搅动全球 AI 格局之际,OpenAI CEO Sam Altman 正在进行他的东京之旅。


截屏2025-02-09 12.11.34.png


与软银创始人孙正义敲定 5000 亿美元的巨额投资之前,Sam Altman 和 OpenAI CPO Kevin Weil 到访了东京大学,在师生问答环节中透露了更劲爆的消息:


「在 OpenAI 内部,我们已经达到了 GPT-4.5,而达到 GPT-5.5 并不需要 100 倍以上的计算能力。」

「推理模型和强化学习技术的进步极大地提高了计算效率 —— 它允许较小的模型实现 GPT-6 级别的性能,而不需要 100 倍以上的计算能力。」

「我们会把所有模态整合在一起,你可以在画布上看到,它一边和你语音,一边为你编写和编译代码。它将能够浏览互联网。」

「o 模型将能支持视觉识别功能,比如某个硬件需要检修,拍一张照片,o 系列模型将能提供技术支持。」

「o3-mini 预示了未来六到十二个月的研究方向...... 我希望到今年年底,我们能开发出一个除了科学发现,其他高难度任务都被它能解决的智能体模型,它可能需要几个小时来思考,甚至可能需要调用一堆工具,但它最终能够为你完成任务。」

虽然这两位 OpenAI 的高管说着自己是来听 bug 和功能需求反馈的,但 Sam Altman 还是在不经意间就透露了 GPT 系列的产品规划以及 DeepSeek 会让 OpenAI 重新考虑是否开源的回应。尤其值得注意的是,OpenAI 接下来的重点将是 高能力的推理模型 多模态 以及 智能体


  • 视频链接:https://www.youtube.com/watch?v=8LmfkUb2uIY


机器之心在不改变对谈原意的基础上划好了这场访谈的重点:

GPT 系列模型未来的发布计划

Q:如果 ChatGPT 获得了 100 倍的算力,它会出现什么新的涌现特性?会出现什么质的飞跃吗?

奥特曼 :我们正在寻找这个问题的确切答案,「星际之门」项目正在推进,它拥有我们当前的计算集群大约 100 倍的计算能力。

我们过去的范式是只做预训练,每一代 GPT,第 1、2、3、4 代,每一代的算力都是之前的大约 100 倍,虽然不是精确的 100 倍,但非常接近。每一次迭代,模型都会出现重要的新涌现特性。

我们已经发展到大约 4.5 代 。所以如果想达到 5.5 代,还需要再增加 100 倍。然而,去年出现了一件最重要的事,那就是 能够进行推理的新模型 。它们在计算效率上有了惊人的提升。通过强化学习,模型可以在很多基准测试上表现出色。 这些成果在以前的思路中要扩张到 GPT-6 才能实现,而现在用更小的模型就能做到

所以,我们现在有了一些新的认识。关键在于,新方法并不是在所有方面都比旧方法更好,只是在某些特定方面有所提升。不过,我们现在可以更清楚地知道,如果我们用这个新方法去训练一个更大的模型,大概会达到什么样的效果。

基于这种跳跃式进展,我所期待的是 AI 自主发现科学知识,特别是新的物理学或新的生物学知识的能力。

近期推理模型的发展确实令人惊叹。我们的第一个推理模型的水平仅相当于世界排名百万开外的竞赛程序员,但随后我们开发的模型已经能够跻身世界排名前一万名。到了 12 月公开发布的 o3 模型,它已经达到了世界第 175 名竞赛程序员的水平。

目前, 我们内部的基准测试显示,模型水平大约在世界前 50 名左右,我相信到今年年底,我们有望冲击世界第一的宝座

新的技术范式展现了惊人的提升速度,并且目前还没有任何放缓的迹象。

Q:能否分享一下你们未来的各个研究领域的研究计划,以及你们目前认为什么是可实现的,什么是特别具有挑战性的?

奥特曼 我们上周五发布了 o3-mini,我认为这预示了未来六到十二个月的研究方向


我们会尽可能推进小型的、令人难以置信的高能力、超快速的推理模型。现在这些模型主要擅长 STEM 领域,但它们最终会在所有方面都变得出色。

我们会把所有模态整合在一起 。所以在同一个模型中, 你可以在画布上看到,它一边和你语音,一边为你编写和编译代码 它将能够浏览互联网,然后我们会继续扩大模型规模 。所以,你知道,希望能达到 GPT-5、6,或者更多。

今天,我们推出了一个叫做 Deep Research 的新功能。这个功能在专业版计划中。它有限地进入 Plus 版本,但目前在专业版计划中。这是我们推出的第二个智能体产品。它真的很棒,我认为这是我们推出过的最好的产品之一。

你可以给它一个任务,这个任务原本需要你花费很多小时或几天在互联网上研究、思考寻找资料,它会给你返回一份报告。它的研究报告确实做得非常好。

比如我很喜欢 90 年代的日本国产车。这个周末我想找一辆特定的车,我找得很困难,于是我想那不如试试用 deep research 来找吧。开始我觉得它不可能找到,结果它找到了整个日本仅有的 3 辆在售车辆,还附带了现成的联系信息。这是一次令人惊叹的体验!

所以 OpenAI 会开发更多这样的智能体 ,会继续推进能够自主完成有用工作的智能体。我们讨论过如何实现编程智能体的梦想,要达到这个目标还需要大量研究,但我认为 Deep Research 将是一个真正重要的里程碑。

总的来说,我希望到今年年底,我们能开发出一个你可以使用的模型。如果你使用的是专业版,你可以将计算能力调到最大,然后向它提出一个非常难的问题 —— 虽然不是那种需要发现新科学的问题,但除此之外的大多数复杂问题都可以 。它会开始工作,可能需要几个小时来思考,甚至可能需要调用一堆工具,但它最终能够为你完成任务。

不过,要实现这个目标,我们还有很长的路要走。这需要巨大的计算规模,也需要更多的算法进步。但我相信,这是可以实现的。

ChatGPT 对高等教育的影响

Q:生成式 AI 在未来 10 年、30 年、100 年将如何改变教育?

奥特曼 :我认为世界上的每个学生、每个人都能获得比当下最顶尖的教育还要优质的教育。有些初创的教育公司正在基于 OpenAI 的技术,为每个人提供量身定制的学习方案,针对他们的薄弱点助力他们终身学习。

我认为这大有前景。学生是 ChatGPT 最大的用户群之一,它天然适合教育,我鼓励大家都去开发这类教学应用。

谈到 100 年后,那将会非常精彩。我还想象不到 100 年后 AI 的能力会如何。先看 10 年后,我认为 AI 仍将极大地改变世。科学进步和科学发现的速度可能比现在快 10 倍,也许是 100 倍。

这将极大地提高生活质量,比如太空探测器将超越太阳系,但与此同时,人们仍会过着一如既往的生活,仍然会有很强的动力去和朋友聚会、建立家庭、发展兴趣爱好。但从另一种意义上说,人之为人的本质不会改变。 我一点也不担心人类会失业,只是环境会改变,工作会不同,但人类社会的运作方式还将如常

Q:全世界如何公平地获取这些 AI 工具?

奥特曼 :我们在办公室经常说 「智能变得如此便宜,以至于不值得去计较成本了」 。我们的目标是努力把智能的成本降到尽可能接近零,让全世界的人都能免费使用。

为了证明我们是认真的,现在的模型比两年前推出的 GPT-3 智能得多,而价格只有 GPT-3 最初的 1%。所以成本已大幅下降,我们想要继续保持这个趋势。

Q:你认为在 AI 时代,亚洲会更看重什么样的人才和技能?给学生们一些建议,你认为什么样的才能和技能最宝贵、最重要?

奥特曼 :我们是否会比 AI 更擅长数学,或者比 AI 更会编程?答案是否定的。你不会在这些方面比 AI 更好。

就像当刚计算器发明时,有人会觉得无论计算器有多厉害,自己还是会在算数方面强过计算器,但我们现在已经知道了,没有人能在算数的方面比过计算器。

所以在 AI 时代所需的具体技能方面,你要能借助 AI 做一些以前没人能做到的事情。 以经营一家公司的方法来用 AI,你提出想法,让 AI 执行,再进行协调

在这个世界里你需要的技能是: 找到人们的需求 具有创造性的愿景 快速适应能力 在一切都在变化时保持韧性 ,以及 学会如何使用这些工具去提效 ,而不是试图做到「我要算得比计算器还快」。

Kevin Weil :对我来说,其中的教训和现在要记住的是:开始使用 AI 工具,开始将它们融入你的工作方式,融入你的学习方式。当你在做事时,先 问问自己:「AI 是否能帮我更快完成?这件事一定要我自己来做吗?还是可以把它外包给 AI?

奥特曼 :有一种错误的观点是,AI 会在所有方面打败人类,人类社会将被 AI 结束,其实不然,作为人类,我们也在适应新技术。这是一种共同进化,我们将在 AI 的助力下获得无法想象的能量,应该这么想。

Kevin Weil :顺便说一下,有一本沃顿商学院教授 Ethan Malik 写的书叫《Co Intelligence》。这本书很短,大约 100 页,但它包含了很多关于他如何用 AI 教学以及学生如何思考与 AI 合作的深刻见解。我认为很值得一读。

「DeepSeek 开源影响你们了吗?」

Q:早些时候,你提到要让智能对每个人都可获取。随着中国 DeepSeek AI 的最近发布以及公开权重和架构,OpenAI 远离开源的有效性受到了质疑。你们是否有计划重新考虑这个立场?理由是什么?


奥特曼 :是的,我们会这样做。我不知道具体要开源什么或者具体什么时候,但对我们来说,发展方向似乎是朝着更多开放模型的方向发展,而社会愿意接受随之而来的权衡,至少目前是这样。我认为我们在让这些模型在开源使用中普遍安全和稳健方面取得了良好进展。它们不会都被这样使用,但大多数时候还会是这样的。

Q:1)过去两年我一直在使用 OpenAI 作为我的个人助理,非常有帮助。我想知道随着脑机接口的发展,你认为它将如何影响人们的意识在未来的存在方式?2)我正在学习小型卫星工程,我在制造用于太空的小型卫星。我有一个关于卫星和 AI 的问题,因为通常来说,将 AI 用于新技术比如卫星、太空这样的领域是非常困难的。所以你对 AI 和空间工程的发展前景有什么看法?3)你能分享一下关于 10 年后 AI 会是什么样子的想法吗?

奥特曼 :让我们快速回答这些问题。关于脑机接口,现在是追求这个的绝佳时机。显然,我们会找到一些解决方案,获得某种直接访问的方式。这可能需要一段时间,但正如你所想的,AI 将会非常惊人。我对许多具有破坏性的方法持怀疑态度,但我认为有一些较轻量级的方法,你可以学习如何使用接口,而且可以逐渐输入到你的大脑中,对吧,我们会找到解决方案的。我认为在过去六个月里,很多有趣的新公司都在朝这个方向发展。Kevin 你要回答太空那个问题吗?






请到「今天看啥」查看全文