面对快速崛起的DeepSeek,美国科技巨头表面上对其技术、产品和方法论赞叹不已,但在战略层面上,并没有对其“小力出奇迹”的策略亦步亦趋。
恰恰相反,在DeepSeek席卷全球AI大模型领域后,巨头们的砸钱迈向了新高度。
以OpenAI为例,奥特曼起初对于DeepSeek有所怀疑,称“并不新颖,我们早已具备这一水平的模型”,且“被严重夸大了”。OpenAI甚至在1月底表示,DeepSeek涉嫌使用OpenAI专有模型训练自己的模型,违反了OpenAI的服务条款。
但短短几天后,奥特曼宣布没有计划起诉DeepSeek,同时称赞“DeepSeek是一个令人印象深刻的模型”。在推出最新的o3-mini模型后,奥特曼甚至表示,在开源方面,OpenAI一直站在“错误的一边”。
DeepSeek大红大紫,逼得奥特曼前倨后恭、低头认错,此情此景让不少人感到惊讶和振奋。但事实上,OpenAI无论是产品还是战略,都没有被DeepSeek这只“黑天鹅”所打乱。
1月底,OpenAI推出o3-mini,并首次向免费用户开放推理模型。测试表明,o3-mini相比上一代o1模型进步极大,多项基准测试表现优异;特别是面对高难度的物理模拟项目——如球体碰撞等,展现出对于R1及其他模型的碾压实力。
几天后,OpenAI又以o3模型为基础发布了Deep Research功能,号称可以在几十分钟内完成人类专家数小时的工作。在涵盖超3000道问题的综合测试“人类最后一场考试”中,Deep Research实现了26.6%的正确率,远超DeepSeek R1的9.4%。
o3-mini采用了许多与R1相同的技术,比如强化学习(RL)、稀疏化MoE、大量监督微调(SFT)等,最终成果也堪称惊艳。然而,Open并没有在研发范式上向DeepSeek靠拢,而是继续沿着“氪金”的路线狂飙。
就在拿出o3-mini对阵DeepSeek R1的同时,OpenAI高调宣布了5000亿美元的“星际之门”计划。根据计划,该计划将在全美国打造20座超算中心;首期将投资1000亿美元,在得州建设10座数据中心。
尽管奥特曼“一生之敌”马斯克火速赶来嘲讽,信誓旦旦地说“他们没有钱”,但星际之门的进展速度颇为惊人。计划公开几天后,奥特曼就晒出了“1号站点”的照片,称之为“宏伟而美丽的建筑”。
尽管星际之门得到了软银和甲骨文的鼎力支持,且去年营收已经高达37亿美元,OpenAI仍在继续储备资金。
据报道,OpenAI正寻求以3400亿美元估值融资400亿美元,软银有望领投。而在短短三个月前,OpenAI刚刚以1570亿美元的估值,融到了66亿美元。