OpenAI发布新AI模型OpenAI o1,将改变推理和编程的游戏规则

AI创业伙伴 · 公众号 · 互联网安全科技自媒体 · 2024-09-13 17:00

正文

OpenAI 重磅发布o1-preview 系列 AI 模型

漫长的等待终于结束，经过多方猜测，OpenAI 发布了全新的 o1-preview 系列 AI 模型。这个系列能够解决科学、编程和数学等领域的复杂难题，现已作为早期预览版在 ChatGPT 和 API 中提供，并将定期更新和完善。

OpenAI 首席执行官 Sam Altman 在 X 上表达了他的自豪：“我为团队感到无比骄傲；这是全公司共同努力的成果。希望你们会喜欢！”他还与 AI 圈内人士 Jimmy Apples 开了个玩笑：“Jimmy，我已经等不及了。”Apples回应道：“感觉很棒，Sam。真的非常棒。”o1 系列模型经过训练，在回复前花更多时间思考，提升了推理过程和问题解决能力。

初步测试显示，推理模型的下一次更新在物理、化学和生物学任务上的表现可媲美博士生，并在数学和编程竞赛中取得了卓越成绩。在国际数学奥林匹克竞赛的资格考试中，该模型得分高达 83%，而 GPT-4o 仅得 13%。

o1 系列模型：思考更深入，推理更强大

虽然 o1-preview 模型具备先进的推理能力，但它缺少了 GPT-4o 的一些实用功能，如浏览网页和文件上传。然而，OpenAI 强调，这款模型在处理复杂任务、尤其是需要多步骤工作流程的领域，展现出了巨大的潜力。作为此次发布的一部分，OpenAI 采用了全新的安全训练方法，使模型在遵守安全规则方面表现更佳。

在越狱测试中，o1-preview 的得分为 84 分（满分 100 分），远超GPT-4o 的 22 分。此外，OpenAI 还通过与美国和英国的 AI 安全机构合作，进一步加强了安全工作。

o1-mini：高性价比的小型模型

除了 o1-preview，OpenAI还推出了一款更小、更具成本效益的模型 o1-mini，专为需要高级编码能力但不具备广泛世界知识的开发者设计。o1-mini 的价格比 o1-preview 便宜了 80%。

从今天起，ChatGPT Plus 和Team 用户可以在模型选择器中手动选择 o1-preview 和 o1-mini。其中，o1-preview 的消息速率限制为 30 条，o1-mini 为 50 条。

最高使用层的 API 用户也可开始原型设计，尽管函数调用和流式传输等功能尚未开放。OpenAI 计划扩大 o1-mini 对 ChatGPT 免费用户的访问权限，并将继续为 o1 系列添加新功能，包括浏览和文件上传。

Cognition Labs 证实：o1系列带来重大改进

Devin 的创建者Cognition Labs 在过去几周与 OpenAI 密切合作，利用 Devin 评估了 OpenAI o1 的推理能力。他们发现，这一新系列模型在处理代码的代理系统上实现了重大改进。

这一切的努力都是为了这一刻。几天前，奥特曼在一则神秘的帖子中暗示，公司正在推进一个内部代号为“草莓计划”的项目，又称 Q*。他在 X 上写道：“我喜欢花园里的夏天”，并配上了一张陶罐中生长着茂盛草莓植株的照片，绿叶葱茏，小草莓正逐渐成熟。

神秘的“草莓计划”浮出水面

据传，“草莓计划”将显著提升 OpenAI 人工智能模型的推理能力，而 o1-preview 显然是这一计划的结晶。同时，OpenAI 正在商讨新一轮融资，估值有望提升至 1500 亿美元。此次融资由 Thrive Capital 领投，将使 Sam Altman 的微软支持公司成为硅谷最具实力的初创企业之一。

商务合作联系人：