清晨六点半,窗外还泛着薄雾般的青灰色,枕边的手机突然发出刺耳的蜂鸣。
迷蒙中伸手摸索着关闭闹钟,一道冷光却猝然刺破昏暗——屏上跳出的消息写着:“o3-mini 来了”。
瞬间,尚未清醒的神经仿佛被注入了一剂浓缩咖啡,我猛地从床上坐起,连拖鞋都来不及穿就冲向了电脑。
今天,OpenAI 发布了两个版本:o3-mini 和 o3-mini-high。
o3-mini 系列:小型推理模型的全新进化
o3-mini 是 OpenAI 推理模型系列的最新力作。
根据官方介绍,这款模型不仅是“轻量级”的代表,更代表了小型 AI 推理模型的一次全面进化:
这款模型在高效推理能力和高效运算处理之间找到了完美的平衡,特别在 STEM(科学、技术、工程、数学) 任务中表现尤为突出。
这次的发布,不仅仅是技术上的一次进步,更是重新定义传统推理模型的边界。
或许是被DeepSeek卷到了,这是OpenAI首次向用户免费推出的推理模型。
同时还支持实时搜索功能,并获得相关网页链接,使得回答更丰富、实时。
OpenAI 提到,这虽然目前还处于原型阶段,但他们正在努力将搜索功能深入整合到推理模型中,以便为用户提供更加精准和实时的反馈。
免费用户可以通过选择“搜索+推理”来使用体验o3-mini。
实战体验:从“降智”疑虑到真实表现
第一次上手,画风是这样的。
我大吃一惊,不至于这么拉胯吧,这是事实吗?
而且这输出的速度也太快了吧,并且没有思考的过程,这里面一定有猫腻。
当我换成电脑,重新测试之后,我发现正常运行的 o3-mini-high 模型,是有思考过程的,而且是全英文,内容如下:
而最终的输出的结果,还是中文(下图所示),干净利落。
那为什么会出现这样的情况?
这让我联想到所谓的 “降智” 问题,也许以后有机会专门开篇讨论这个话题。
另外一个测试,经典问题:
“今天买了三个苹果,我昨天吃了一个,我还有几个呢?”
这一常见问题,许多模型回答失误,而 o3-mini 则毫无问题地给出正确答案。
接下来的网友测试进一步印证 o3-mini 的强大。
o3-mini 可能是最适合现实物理学的大语言模型。
Prompt: "write a python script of a ball bouncing inside a tesseract"
在另一个测试中,o3-mini 同样表现突出:
Prompt: “Write a p5.js script that simulates 100 colorful balls bouncing inside a sphere. Each ball should leave behind a fading trail showing its recent path. The container sphere should rotate slowly. Make sure to implement proper collision detection so the balls stay within the sphere.”
o3-mini 不仅输出精准、迅速,还能准确把握物理法则,完美实现编程与物理模拟的结合。
看一下与
DeepSeek-R1对比的测试
Prompt: "write a Python program that shows a ball bouncing inside a spinning hexagon. The ball should be affected by gravity and friction, and it must bounce off the rotating walls realistically"
可以看到,
o3-mini的效果更接近实际需求。
接下来,我们来看一下 o3-mini high 在性能、速度和价格上的综合表现,简直让所有竞争对手无地自容。
从图中可以看到,o3-mini high 在 整体表现和编程速度上都遥遥领先。
定价情况
OpenAI 的 o3-mini 定价在不同用户类型和 API 使用下有所不同。
对于 ChatGPT 用户,免费用户只能有限访问 o3-mini(通过选择 “推理”),而 Plus/Team 用户 可享有每日 150 条消息的访问权限,Pro 用户 则可以支付每月 200 美元 获得 无限制访问。
对于 API 用户,定价如下:
与之相比,DeepSeek-R1 的定价显然更具竞争力,输入和输出的费用分别为 0.14 美元 和 0.55 美元,远低于 o3-mini 的收费。
两个月前,强大的推理模型仅通过订阅提供,现如今,无论是 DeepSeek-R1 还是 ChatGPT(o3-mini),都可以免费体验这种强大推理能力。
对于大部分用户和开发者来说,
无疑
降低了
进入门槛,使更多的人能够享受到 AI 推理的强大力量。
当然,o3-mini high 和 o1-pro 等最强模型依然需要付费。
不管怎么样,这对用户来说都是好消息。
另外,在发布会结束后的 Reddit “有问必答”活动中,Sam Altman 也透露出一些行业策略变化:
“我们将比往年保持的领先优势更小”
“重新思考开源策略”
这两点无疑进一步表明在 DeepSeek 带来的冲击下,OpenAI 正在积极调整战略,以适应新一轮的技术变革。
说到最后,重点在这