专栏名称: 学术头条
致力于科学传播和学术分享,关注计算机科学、认知科学、人工智能科学、神经科学、脑科学等学科领域。我们从跨学科的角度,围绕“认知智能”向科学界和大众介绍相关领域的前沿话题和深度解读。
目录
相关文章推荐
开发者全社区  ·  山东相亲食物链:码农沦为底层 ·  20 小时前  
开发者全社区  ·  章泽天那个时候好嫩啊! ·  昨天  
开发者全社区  ·  币圈大瓜! ·  2 天前  
开发者全社区  ·  体制内的一张图 ·  3 天前  
开发者全社区  ·  计算机开始跌落神坛,想不到这么差... ·  3 天前  
51好读  ›  专栏  ›  学术头条

OpenAI内部模型曝光!编程能力跻身全球Top50程序员,年底不再有人类对手

学术头条  · 公众号  ·  · 2025-02-10 11:19

正文


内容来自:量子位
作者:一水


除了o1/o3,OpenAI另一个尚未公开的内部推理模型曝光了。


爆料者正是CEO奥特曼本人。


据他透露,与全球顶尖程序员相比,当前这一内部模型的编程能力已达Top50,甚至今年年底将排名第一。



而且针对大家近来尤为关注的算力问题,他更是直言:


在内部,我们已经达到了GPT 4.5,而达到GPT 5.5并不需要100倍以上的计算能力。



除此之外,也是在东京大学的这场对话活动中,奥特曼由AI对教育的影响引出了更多话题,包括AI时代需要何种人才,以及一系列对内部模型进展的爆料。


这场对话由东京大学的校长(Teruo Fujii)和执行副校长(Kaori Hayashi,女)主持,OpenAI首席产品官Kevin Weil陪同奥特曼参加。


期间,他们畅谈了AI的应用和未来,并和学生进行了面对面问答。


以下为重点内容整理&摘录。



内部模型已达GPT 4.5,升级成5.5不再需要100倍算力升级


主持人简短开场后,活动由学生提问开启。


谈及AI对教育的影响以及未来这一领域的发展,奥特曼直言教育是OpenAI最关注的几个领域之一。


目前已经能看到ChatGPT如何为学生提供各种辅助,未来类似AI工具只是改变了环境和部分人类习惯,对于人类来说可能是一种解放,不用过于担心AI会改变一切。


另外,由于科学发现可能呈现10~100倍增速,由AI推动的生产力进步可能极大促进社会发展。



接下来副校长也提了一个问题,AI时代需要怎样的人才和技能?


对此奥特曼回应称,显然人类现在已经很难在数学、编程等具体任务中优于AI,因此围绕弄清楚人们需要什么,去培养个人的开创性视野、快速适应能力等也就更加重要。


Kevin总结了一个更简单的办法,从现在开始将AI用起来,将之融入工作生活。一旦遇到新问题,尝试用AI解决,以此逐渐跟上AI发展的步伐。



随后,有学生提到了算力进化问题,如果拥有100倍计算能力,可以期望GPT具有哪些新特性?


奥特曼称,GPT系列代表了曾经的一个范式,专注预训练部分,GPT 1,2,3,4的每一次升级都大致意味着100倍算力升级,随之也产生了更强的能力。


目前内部模型已经达到GPT 4.5水平,照旧范式推测,达到GPT 5.5也需要100倍算力升级。然而,随着o1系列推理模型取得新突破,一种令人难以置信的新计算效率诞生了。


这也意味着类似升级不再需要100倍算力,通过强化学习等技术我们也能得到更强的模型能力。



之后奥特曼梳理了OpenAI在推理模型上取得的一系列进展,按网友总结下来就是:


编程能力上,o1排名为9800;仅过去几个月,o3将排名拉到第175位;如今一个内部模型在基准测试中排名约为TOP50,而且年底就能直接登顶。




“我们希望朝着开源前进”


接下来,奥特曼谈到了更多未来计划。


o3的发布已经为未来6到12个月的研究点明了方向,OpenAI将尽可能推动小型、功能强大且速度极快的推理模型,同时也会继续推进GPT 6/7等。


过程中,他着重cue到了OpenAI最近向Pro用户推出的“深度研究”(Deep Research)功能,这是一个使用推理来综合大量在线信息并为用户完成多步骤研究任务的智能体,能帮助用户进行深入、复杂的信息查询与分析。


在他看来,OpenAI一大重点也是发布更多此类智能体,而且梦想之一是搞一个编程智能体。







请到「今天看啥」查看全文


推荐文章
开发者全社区  ·  山东相亲食物链:码农沦为底层
20 小时前
开发者全社区  ·  章泽天那个时候好嫩啊!
昨天
开发者全社区  ·  币圈大瓜!
2 天前
开发者全社区  ·  体制内的一张图
3 天前
开发者全社区  ·  计算机开始跌落神坛,想不到这么差...
3 天前
天才宝宝育儿  ·  玩具,我只给孩子5样
8 年前