专栏名称: 大数据文摘

普及数据思维，传播数据文化

目录

相关文章推荐

大数据文摘 · 超强AI代理上线！OpenAI推出“Deep ... · 2 天前

肉眼品世界 · 【麦肯锡】数据治理与数据架构总体设计咨询方案 ... · 昨天

肉眼品世界 · 【麦肯锡】数据治理与数据架构总体设计咨询方案 ... · 昨天

软件定义世界（SDX） · DeepSeek创始人梁文锋5年前的演讲：一 ... · 3 天前

大数据分析和人工智能 · 10个超级实用的deepseek提示方式 · 5 天前

玉树芝兰 · 能反思的 AI ... · 5 天前

51好读 › 专栏 › 大数据文摘

GPT-6曝光！阉割版「草莓」秋季兑现

大数据文摘 · 公众号 · 大数据 · 2024-08-28 18:30

主要观点总结

本文主要介绍了OpenAI的Q*项目，即Strawberry草莓模型的最新进展和相关信息。文章提到该模型拥有强大的推理和数学能力，减少了幻觉问题，并具备主动解决问题的能力。然而，其上线时间一直受到推迟，引发了公众质疑和关注。OpenAI对此回应称存在安全和竞争考量。同时，OpenAI决定使用Strawberry模型训练新的Orion模型，并可能在未来发布Strawberry聊天模型。文章还讨论了OpenAI可能走向闭源和盈利的趋势及其对未来竞争格局的影响。

关键观点总结

关键观点1: Strawberry模型的特点和进展

Strawberry模型拥有强大的推理和数学能力，减少了幻觉问题，并具备主动解决问题的能力。该模型已经定档于秋季上线，但目前存在一些延迟问题。

关键观点2: OpenAI对Strawberry模型上线延迟的回应

OpenAI表示，Strawberry模型延迟上线存在安全和竞争考量。安全方面，该模型需要确保没有数据泄露等问题；竞争方面，OpenAI选择训练更先进的Orion模型，以确保在竞争中的领先地位。

关键观点3: OpenAI的未来计划和影响

OpenAI计划使用Strawberry模型生成高质量合成数据来训练Orion模型。未来，OpenAI可能会进一步封闭，选择使用合成数据来训练下一代模型，以保持领先地位。这一趋势可能对开源模型和竞争格局产生影响。

正文

大数据文摘受权转载自夕小瑶科技说
作者 | 海野

OpenAI的Q* 项目，也就是后来在网上沸沸扬扬的Strawberry草莓，终于定档于秋季上线。

据The Information爆料，作为GPT-4的下一代，Strawberry很惊艳：

拥有极强的推理和数学能力；
减少了幻觉问题；
能够主动进行“思考”，解决复杂的问题（耗时较长）。

根据路透社的报道，早在七月份，OpenAI就已经向美国国家安全局展示过这个模型的技术。OpenAI内部也已经在使用这个新的模型。

而在八月初，Sam Altman发布了一些带草莓照片的推文，这种暗示不言而喻：昭告所有人，草莓模型要来了！

哎……它真来了吗？OpenAI卷起了草莓狂欢热，却没有带来对应的期货。互联网上逐渐出现一些质疑声，痛批OpenAI的无实物炒作。

与此同时，OpenAI的其他弊病也被披露出来：

已经预告了数个月的sora模型，迟迟没有上线；
searchGPT暂停开放测试；
GPT-4o的语音功能依然在waiting list，仅限少部分人使用。
以Claude为首的各家大模型，逐渐在不同方面超越了GPT-4o，而OpenAI并没有进行反击，也没有带来更强的新模型。
等等等等……

直至今日，OpenAI依然在巨大的舆论风波之中。终于，OpenAI带来了一个振奋人心的消息：Strawberry不是终点，我们开始用Strawberry训练新的模型Orion ！

而关于Strawberry模型的问题，OpenAI也做出了回应

为什么迟迟没有上线?

一言概之就两个问题：安全和竞争。

关于安全问题，我们看OpenAI最近常发的文章就可以知晓：

OpenAI在安全方面做出了很多举措。由于发布安全问题推文的频率之高，OpenAI甚至被网友们戏称，应该改名为SafeAI。

但即便是这样的安全保障举措，依然没有讨得美国国家安全局的芳心。

此前，因为人工智能发展速度过快，安全和监管没有起到应有的效果，人工智能先驱Yoshua Bengio决定与人工智能教父Geoff Hinton一起，投入更多精力来倡导人工智能监管。

另外，美国国家安全局的另一个考量是，要防止其他国家使用strawberry模型合成数据，从而训练出更强大的模型。

出于各种安全考虑，Strawberry模型被禁止直接向公众提供服务。

所以，接下来在秋季公开的Strawberry，也是一个小型的蒸馏模型，削弱了推理能力，更主要的用于聊天。不过也能满足公众的个人使用需求。

根据预测，Strawberry聊天模型可能会在十月Devday的时间上线；也有可能会在十一月美国大选结束后上线。

Strawberry模型的完全体，则会在OpenAI的内部使用，用来生成高质量的合成数据，训练Orion模型——GPT-6。

而OpenAI选择这样举措的原因，就是竞争的问题了。

OpenAI，选择了更进一步封闭

OpenAI放弃了strawberry完全体（GPT-5）模型的发布，转而训练更先进的模型Orion，以确保自己能断崖式的碾压竞争对手。

OpenAI似乎忘记了自己的原始使命（开发开源技术造福人类），转而走向了闭源和盈利。而对于这项选择，我们也不难看出OpenAI的考量：

为什么在GPT-4上线后，各竞争对手以及开源模型，进步速度突飞猛进？因为GPT-4经常被用于合成数据，这些合成数据就会被用来训练其他家的模型。

要知道，优质的大模型往往建立在庞大的数据集的训练上，而现有的公开真实数据，早已被各家厂商用遍了。拉开差距的方法之一，就是使用人为创建的合成数据。创建合成数据使用的模型越先进，数据集越强大。

为了避免这种情况继续发生，为了保持领先地位，OpenAI只能选择闭境自守，用下一代模型训练下下代模型，从而实现遥遥领先。

如果OpenAI真的可以实现如此成效，那各大开源模型可能要狠狠地吃瘪了。这一场比赛很可能会演变成一次文明的游戏。

OpenAI的动向也透露出一个信号，也许不久后，这种超级AI会成为新的封闭的资源，对其进行掌握和控制，会成为下一轮科技竞赛的核心。

参考资料

[1]https://x.com/imxiaohu/status/1828258507197690201

请到「今天看啥」查看全文

推荐文章

大数据文摘 · 超强AI代理上线！OpenAI推出“Deep Research”，媲美研究分析师水平？

2 天前

肉眼品世界 · 【麦肯锡】数据治理与数据架构总体设计咨询方案（附下载）

昨天

肉眼品世界 · 【麦肯锡】数据治理与数据架构总体设计咨询方案（附下载）

昨天

软件定义世界（SDX） · DeepSeek创始人梁文锋5年前的演讲：一名程序员眼里中国量化投资的未来

3 天前

大数据分析和人工智能 · 10个超级实用的deepseek提示方式

5 天前

玉树芝兰 · 能反思的 AI 搜索应用，如何帮你克服「写作障碍」？

5 天前

南方日报 · 独家！2017年在广东做什么最赚钱？政府工作报告最干货在这里！

8 年前

新浪科技 · 微信公众号付费近期推出会干死其他付费产品吗？

7 年前

考研研学姐 · 2017考研: 成绩不理想要二战? 你真的想好了吗?

7 年前

东灵通知识产权 · 老梁讲述|山寨商标，究竟害了谁？

7 年前

上海租售情报 · 最受小偷欢迎小区榜单发布你会买吗？

7 年前

Sov5搜索 · 小百科 · 今天看啥 · 移动版

51好读 - 好文章就要读起来!