专栏名称: 大数据文摘
普及数据思维,传播数据文化
目录
相关文章推荐
大数据文摘  ·  超强AI代理上线!OpenAI推出“Deep ... ·  2 天前  
软件定义世界(SDX)  ·  DeepSeek创始人梁文锋5年前的演讲:一 ... ·  3 天前  
大数据分析和人工智能  ·  10个超级实用的deepseek提示方式 ·  5 天前  
玉树芝兰  ·  能反思的 AI ... ·  5 天前  
51好读  ›  专栏  ›  大数据文摘

GPT-6曝光!阉割版「草莓」秋季兑现

大数据文摘  · 公众号  · 大数据  · 2024-08-28 18:30

主要观点总结

本文主要介绍了OpenAI的Q*项目,即Strawberry草莓模型的最新进展和相关信息。文章提到该模型拥有强大的推理和数学能力,减少了幻觉问题,并具备主动解决问题的能力。然而,其上线时间一直受到推迟,引发了公众质疑和关注。OpenAI对此回应称存在安全和竞争考量。同时,OpenAI决定使用Strawberry模型训练新的Orion模型,并可能在未来发布Strawberry聊天模型。文章还讨论了OpenAI可能走向闭源和盈利的趋势及其对未来竞争格局的影响。

关键观点总结

关键观点1: Strawberry模型的特点和进展

Strawberry模型拥有强大的推理和数学能力,减少了幻觉问题,并具备主动解决问题的能力。该模型已经定档于秋季上线,但目前存在一些延迟问题。

关键观点2: OpenAI对Strawberry模型上线延迟的回应

OpenAI表示,Strawberry模型延迟上线存在安全和竞争考量。安全方面,该模型需要确保没有数据泄露等问题;竞争方面,OpenAI选择训练更先进的Orion模型,以确保在竞争中的领先地位。

关键观点3: OpenAI的未来计划和影响

OpenAI计划使用Strawberry模型生成高质量合成数据来训练Orion模型。未来,OpenAI可能会进一步封闭,选择使用合成数据来训练下一代模型,以保持领先地位。这一趋势可能对开源模型和竞争格局产生影响。


正文

 大数据文摘受权转载自夕小瑶科技说
 作者 | 海野

OpenAI的Q* 项目,也就是后来在网上沸沸扬扬的Strawberry草莓,终于定档于秋季上线。
据The Information爆料,作为GPT-4的下一代,Strawberry很惊艳:
  • 拥有极强的推理和数学能力;
  • 减少了幻觉问题;
  • 能够主动进行“思考”,解决复杂的问题(耗时较长)。
根据路透社的报道,早在七月份,OpenAI就已经向美国国家安全局展示过这个模型的技术。OpenAI内部也已经在使用这个新的模型。
而在八月初,Sam Altman发布了一些带草莓照片的推文,这种暗示不言而喻:昭告所有人,草莓模型要来了!


哎……它真来了吗?OpenAI卷起了草莓狂欢热,却没有带来对应的期货。互联网上逐渐出现一些质疑声,痛批OpenAI的无实物炒作。


与此同时,OpenAI的其他弊病也被披露出来:
已经预告了数个月的sora模型,迟迟没有上线;
searchGPT暂停开放测试;
GPT-4o的语音功能依然在waiting list,仅限少部分人使用。
以Claude为首的各家大模型,逐渐在不同方面超越了GPT-4o,而OpenAI并没有进行反击,也没有带来更强的新模型。
等等等等……
直至今日,OpenAI依然在巨大的舆论风波之中。终于,OpenAI带来了一个振奋人心的消息:Strawberry不是终点,我们开始用Strawberry训练新的模型Orion !
而关于Strawberry模型的问题,OpenAI也做出了回应

为什么迟迟没有上线?


一言概之就两个问题:安全和竞争。
关于安全问题,我们看OpenAI最近常发的文章就可以知晓:

OpenAI在安全方面做出了很多举措。由于发布安全问题推文的频率之高,OpenAI甚至被网友们戏称,应该改名为SafeAI。
但即便是这样的安全保障举措,依然没有讨得美国国家安全局的芳心。
此前,因为人工智能发展速度过快,安全和监管没有起到应有的效果,人工智能先驱Yoshua Bengio决定与人工智能教父Geoff Hinton一起,投入更多精力来倡导人工智能监管。


另外,美国国家安全局的另一个考量是,要防止其他国家使用strawberry模型合成数据,从而训练出更强大的模型。
出于各种安全考虑,Strawberry模型被禁止直接向公众提供服务。
所以,接下来在秋季公开的Strawberry,也是一个小型的蒸馏模型,削弱了推理能力,更主要的用于聊天。不过也能满足公众的个人使用需求。
根据预测,Strawberry聊天模型可能会在十月Devday的时间上线;也有可能会在十一月美国大选结束后上线。


Strawberry模型的完全体,则会在OpenAI的内部使用,用来生成高质量的合成数据,训练Orion模型——GPT-6。
而OpenAI选择这样举措的原因,就是竞争的问题了。

OpenAI,选择了更进一步封闭


OpenAI放弃了strawberry完全体(GPT-5)模型的发布,转而训练更先进的模型Orion,以确保自己能断崖式的碾压竞争对手。


OpenAI似乎忘记了自己的原始使命(开发开源技术造福人类),转而走向了闭源和盈利。而对于这项选择,我们也不难看出OpenAI的考量:
为什么在GPT-4上线后,各竞争对手以及开源模型,进步速度突飞猛进?因为GPT-4经常被用于合成数据,这些合成数据就会被用来训练其他家的模型。
要知道,优质的大模型往往建立在庞大的数据集的训练上,而现有的公开真实数据,早已被各家厂商用遍了。拉开差距的方法之一,就是使用人为创建的合成数据。创建合成数据使用的模型越先进,数据集越强大。


为了避免这种情况继续发生,为了保持领先地位,OpenAI只能选择闭境自守,用下一代模型训练下下代模型,从而实现遥遥领先。
如果OpenAI真的可以实现如此成效,那各大开源模型可能要狠狠地吃瘪了。这一场比赛很可能会演变成一次文明的游戏。
OpenAI的动向也透露出一个信号,也许不久后,这种超级AI会成为新的封闭的资源,对其进行掌握和控制,会成为下一轮科技竞赛的核心。

参考资料

[1]https://x.com/imxiaohu/status/1828258507197690201





请到「今天看啥」查看全文