专栏名称: AI创业伙伴
AI时代已经来临,做大时代变局的清醒者。
目录
相关文章推荐
酷玩实验室  ·  靠薅打工人的羊毛,快递柜赚了8个亿? ·  昨天  
看雪学苑  ·  House of water & ... ·  2 天前  
看雪学苑  ·  2024 ... ·  1 周前  
少数派  ·  升级半世代、定价创新高:PS5 Pro ... ·  6 天前  
少数派  ·  升级半世代、定价创新高:PS5 Pro ... ·  6 天前  
51好读  ›  专栏  ›  AI创业伙伴

OpenAI发布新AI模型OpenAI o1,将改变推理和编程的游戏规则

AI创业伙伴  · 公众号  · 互联网安全 科技自媒体  · 2024-09-13 17:00

正文

OpenAI 重磅发布o1-preview 系列 AI 模型

漫长的等待终于结束,经过多方猜测,OpenAI 发布了全新的 o1-preview 系列 AI 模型。这个系列能够解决科学、编程和数学等领域的复杂难题,现已作为早期预览版在 ChatGPT 和 API 中提供,并将定期更新和完善。

OpenAI 首席执行官 Sam Altman 在 X 上表达了他的自豪:“我为团队感到无比骄傲;这是全公司共同努力的成果。希望你们会喜欢!”他还与 AI 圈内人士 Jimmy Apples 开了个玩笑:“Jimmy,我已经等不及了。”Apples回应道:“感觉很棒,Sam。真的非常棒。”o1 系列模型经过训练,在回复前花更多时间思考,提升了推理过程和问题解决能力。

初步测试显示,推理模型的下一次更新在物理、化学和生物学任务上的表现可媲美博士生,并在数学和编程竞赛中取得了卓越成绩。在国际数学奥林匹克竞赛的资格考试中,该模型得分高达 83%,而 GPT-4o 仅得 13%。

o1 系列模型:思考更深入,推理更强大

虽然 o1-preview 模型具备先进的推理能力,但它缺少了 GPT-4o 的一些实用功能,如浏览网页和文件上传。然而,OpenAI 强调,这款模型在处理复杂任务、尤其是需要多步骤工作流程的领域,展现出了巨大的潜力。作为此次发布的一部分,OpenAI 采用了全新的安全训练方法,使模型在遵守安全规则方面表现更佳。

在越狱测试中,o1-preview 的得分为 84 分(满分 100 分),远超GPT-4o 的 22 分。此外,OpenAI 还通过与美国和英国的 AI 安全机构合作,进一步加强了安全工作。

o1-mini:高性价比的小型模型

除了 o1-preview,OpenAI还推出了一款更小、更具成本效益的模型 o1-mini,专为需要高级编码能力但不具备广泛世界知识的开发者设计。o1-mini 的价格比 o1-preview 便宜了 80%。

从今天起,ChatGPT Plus 和Team 用户可以在模型选择器中手动选择 o1-preview 和 o1-mini。其中,o1-preview 的消息速率限制为 30 条,o1-mini 为 50 条。


最高使用层的 API 用户也可开始原型设计,尽管函数调用和流式传输等功能尚未开放。OpenAI 计划扩大 o1-mini 对 ChatGPT 免费用户的访问权限,并将继续为 o1 系列添加新功能,包括浏览和文件上传。

Cognition Labs 证实:o1系列带来重大改进

Devin 的创建者Cognition Labs 在过去几周与 OpenAI 密切合作,利用 Devin 评估了 OpenAI o1 的推理能力。他们发现,这一新系列模型在处理代码的代理系统上实现了重大改进。

这一切的努力都是为了这一刻。几天前,奥特曼在一则神秘的帖子中暗示,公司正在推进一个内部代号为“草莓计划”的项目,又称 Q*。他在 X 上写道:“我喜欢花园里的夏天”,并配上了一张陶罐中生长着茂盛草莓植株的照片,绿叶葱茏,小草莓正逐渐成熟。

神秘的“草莓计划”浮出水面

据传,“草莓计划”将显著提升 OpenAI 人工智能模型的推理能力,而 o1-preview 显然是这一计划的结晶。同时,OpenAI 正在商讨新一轮融资,估值有望提升至 1500 亿美元。此次融资由 Thrive Capital 领投,将使 Sam Altman 的微软支持公司成为硅谷最具实力的初创企业之一。

 商务合作联系人: