专栏名称: 新浪科技

一手掌握，科技“鲜”闻

DeepSeek劝不了谷歌们

新浪科技 · 公众号 · · 2025-02-09 18:27

正文

出品 / 字母榜（ID: wujicaijing）

作者 / 彦飞

过去一个月，DeepSeek以大约十分之一的训练成本，推出与OpenAI o1性能接近的开源模型R1，“小力出奇迹”的新范式震撼全球AI大模型行业。同时，外界对于大型科技公司动辄数百亿美元的AI研发开支，也产生了越来越多的质疑。

但被“DeepSeek冲击”吓了一跳的科技巨头，并没有因此改弦更张。相反，他们正挥舞着支票簿，试图靠疯狂砸钱，重新夺取AI大模型的制高点。

2月5日，谷歌母公司Alphabet发布2024年第四季度财报，营收和净利润均实现两位数百分比的同比增长。引人注目的是，Alphabet宣布，2025财年的资本支出将达到750亿美元（约合人民币5454亿元），以继续扩展其人工智能战略。

一年投入750个“小目标”研发AI，远远超出了华尔街599.4亿美元的预期。不过，谷歌有实力如此烧钱：截至去年底，它持有现金、现金等价物及有价证券约957亿美元。

稍早时候，谷歌还向AI明星创业公司Anthropic追加投资10亿美元。2023年至今，谷歌向这家公司累计投资35.5亿美元。

财大气粗的谷歌投身AI烧钱竞赛，其他科技巨头也不遑多让。

今年1月初，微软宣布将于2025财年投资800亿美元，建设AI数据中心。这笔投资创下了微软成立以来的单笔投资最高记录。而在上一财年，微软的资本支出超500亿美元，大部分用于AI相关的基础设施。

社交网络巨头Meta在1月底宣布，公司将在今年投资600亿~650亿美元，并大幅扩张AI团队，以期实现Meta AI服务10亿人、Llama 4成为行业领先大模型的目标。Meta创始人扎克伯格称，今年将是“AI决定性的一年”。

OpenAI则拉上软银、甲骨文、微软、ARM、英伟达预计投资5000亿美元。中东人工智能基金（MGX）等产业和投资巨头，联手成立“星际之门”，这些资金将被用于数据中心等AI基础设施的建设与运营。

相比之下，国内科技巨头面向AI大模型的砸钱规模小了一个数量级，但也动辄数百亿元，且增长很快。

根据财报等公开信息，2024年前三季度，百度、阿里、腾讯的总资本开支约为人民币867亿元。金融数据服务商Visible Alpha预计，到2027年，BAT的资本支出将达到1767亿元，年复合增长率超26%。考虑到BAT的重视程度，这些资本开支将有很大一部分流向AI大模型。

不难看出，科技巨头发展AI大模型，砸钱仍然是基本武器之一。尽管DeepSeek证明了“小力出奇迹”的可行性，但巨头们出于多种原因，仍然沿着“大力出奇迹”的路线前行。

这并非仅仅是大公司的惯性使然。OpenAI刚刚发布的o3-mini，已经在物理推理等多项指标上反超R1，而更强大的o3标准版也已经箭在弦上。这也再次证明，“尺度定律”仍然是AI大模型的基本规则之一，而“小力出奇迹”并非置之四海而皆准。

尚未找到“金主爸爸”的DeepSeek，在算力、数据、资金和资源方面比不上巨头，正面临被后来者强行超车的危险。不过，R1的成功，也证明了“小力出奇迹”的可行。在DeepSeek震动全球AI圈后，巨头青睐的“砸钱”与“小力出奇迹”的路线之争仍在继续，远未分出胜负。

面对快速崛起的DeepSeek，美国科技巨头表面上对其技术、产品和方法论赞叹不已，但在战略层面上，并没有对其“小力出奇迹”的策略亦步亦趋。

恰恰相反，在DeepSeek席卷全球AI大模型领域后，巨头们的砸钱迈向了新高度。

以OpenAI为例，奥特曼起初对于DeepSeek有所怀疑，称“并不新颖，我们早已具备这一水平的模型”，且“被严重夸大了”。OpenAI甚至在1月底表示，DeepSeek涉嫌使用OpenAI专有模型训练自己的模型，违反了OpenAI的服务条款。

但短短几天后，奥特曼宣布没有计划起诉DeepSeek，同时称赞“DeepSeek是一个令人印象深刻的模型”。在推出最新的o3-mini模型后，奥特曼甚至表示，在开源方面，OpenAI一直站在“错误的一边”。

DeepSeek大红大紫，逼得奥特曼前倨后恭、低头认错，此情此景让不少人感到惊讶和振奋。但事实上，OpenAI无论是产品还是战略，都没有被DeepSeek这只“黑天鹅”所打乱。

1月底，OpenAI推出o3-mini，并首次向免费用户开放推理模型。测试表明，o3-mini相比上一代o1模型进步极大，多项基准测试表现优异；特别是面对高难度的物理模拟项目——如球体碰撞等，展现出对于R1及其他模型的碾压实力。

几天后，OpenAI又以o3模型为基础发布了Deep Research功能，号称可以在几十分钟内完成人类专家数小时的工作。在涵盖超3000道问题的综合测试“人类最后一场考试”中，Deep Research实现了26.6%的正确率，远超DeepSeek R1的9.4%。

o3-mini采用了许多与R1相同的技术，比如强化学习（RL）、稀疏化MoE、大量监督微调（SFT）等，最终成果也堪称惊艳。然而，Open并没有在研发范式上向DeepSeek靠拢，而是继续沿着“氪金”的路线狂飙。

就在拿出o3-mini对阵DeepSeek R1的同时，OpenAI高调宣布了5000亿美元的“星际之门”计划。根据计划，该计划将在全美国打造20座超算中心；首期将投资1000亿美元，在得州建设10座数据中心。

尽管奥特曼“一生之敌”马斯克火速赶来嘲讽，信誓旦旦地说“他们没有钱”，但星际之门的进展速度颇为惊人。计划公开几天后，奥特曼就晒出了“1号站点”的照片，称之为“宏伟而美丽的建筑”。

尽管星际之门得到了软银和甲骨文的鼎力支持，且去年营收已经高达37亿美元，OpenAI仍在继续储备资金。

据报道，OpenAI正寻求以3400亿美元估值融资400亿美元，软银有望领投。而在短短三个月前，OpenAI刚刚以1570亿美元的估值，融到了66亿美元。

奥特曼仿佛患上“资金短缺恐惧症”，一边疯狂融资，一边大手笔花钱。与之正面PK的其他科技巨头，砸钱同样毫不手软。

今年，谷歌、微软、Meta等均计划投入数百亿美元发展AI，力度之大远超华尔街预期。以Meta为例，扎克伯格计划斥资至少600亿美元，建设一座拥有130万块GPU的AI数据中心。

作为对比，据科技咨询公司Omdia测算，字节去年买了23万块GPU，且为性能较弱的英伟达特供版。即便如此，这一数字也远远超出了DeepSeek目前持有的芯片规模。

除了海外科技巨头，国内互联网公司也在AI大模型领域投入巨资。DeepSeek的“小力出奇迹”，并没有改写这一局面。

一度在AI大模型领域落后的字节，近两年洒下重金。浙商证券在一份报告中称，2024年字节资本开支约800亿元，接近BAT的总和。

另有报道称，字节2025年资本开支将超1500亿，大部分用于AI。字节方面随后否认了这一说法。

此外，字节持续“扫货”国内AI领域的顶级人才。据《财经天下》报道，字节某些AI方向的业务团队在招募知名院校博士应届生时，年薪可达两三百万元，远超其他大厂的100万元左右。此外，张一鸣还亲自从阿里等对手挖人。

除了研发费用和人才成本，过去一两年，字节在B端和C端同时为AI烧钱，力图争夺更多企业和个人用户。

在B端，豆包大模型自去年5月发布之后不断降价，堪称国内AI大模型圈子的“价格屠夫”。据统计，豆包文字大模型比行业便宜99.3%，去年12月发布的视觉理解模型比行业便宜85%。

同时，在C端，豆包依靠广泛投流拉新。据AppGrowing统计，去年4~5月，豆包投放金额预计为1500万~1750万元。6月上旬，豆包启动新一轮投放活动，投放金额高达1.24亿元。

在猛砸资金后，豆包的用户量猛增，成为国内用户最多的大模型应用。

阿里同样在AI大模型领域持续投入大笔资金。今年总台春晚，阿里云成为云计算AI独家合作伙伴。仅2024年上半年，阿里在AI基础设施上的资本支出就达到230亿元。此外，阿里花费超百亿元，投资AI创业公司“六小虎”。

腾讯方面，过去六年其研发总投入超2850亿元，其中很大一部分投向了AI。而在AI“六小虎”中，腾讯投资了其中五家。

仅就花钱力度而言，新BAT比不过谷歌、Meta、OpenAI，但依然是国内AI大模型圈独一档的存在。相比之下，一直没有融资的DeepSeek，仍然靠母公司幻方量化输血；但国内量化投资近年来处于行业谷底，DeepSeek能够得到的资金支持恐怕不会很多。

不过，面对DeepSeek的强势崛起，新BAT在继续大手笔投钱的同时，也试图伸出橄榄枝、构建“双保险”。

1月底、2月初，国内主要云服务厂商均宣布接入DeepSeek大模型。阿里云宣布支持云上一键部署V3和R1，百度智能云、腾讯云、字节旗下火山引擎等也先后宣布了类似功能。

众所周知，DeepSeek采用了最“慷慨”的开源协议，并不限制第三方对于自家开源模型的商用。阿里云等厂商第一时间接入DeepSeek大模型，能够借着后者的泼天流量，为自己争取一波关注度和新用户。

另一方面，向DeepSeek伸出橄榄枝，也侧面表明了大厂的心态：即便DeepSeek与自家AI业务存在竞争，也不妨先为我所用，并从中获得技术、产品等方面的启发。这些主动示好的举动，也为双方未来更大规模的合作留下了想象空间。

DeepSeek以“小力出奇迹”扬名天下，但目前为止，这一颇为性感的新范式并未得到国内外大厂的全面认可与接纳。砸钱、砸资源的“大力出奇迹”，依然是大厂参与AI大模型竞争的主要打法。

与此同时，随着竞争对手以新一代模型反击，叠加自身规模扩大导致的种种问题，DeepSeek正面临被全面反超的危险。

产品上，越来越多的用户发掘，DeepSeek的大模型幻觉频繁出现。无论是谈论从A到B的最佳路线，还是解析某一首歌曲，亦或是分析某一专业话题，DeepSeek都存在较为严重的“一本正经胡说八道”问题。

大模型幻觉一直广泛存在，也是整个AI圈子始终未能克服的难题。DeepSeek在这方面并没有展现比其他模型更出色的性能，折射出仅靠大模型工程层面的创新，并不足以攻克更基础的AI难题。

另一方面，短时间内疯狂涌入的全球用户，也让DeepSeek有些力不从心。

据统计，DeepSeek自上线各大应用商店以来，短期内获得1600万次下载，登顶140个应用市场，最高日活跃用户突破2200万。由于用户太多，DeepSeek的深度思考和联网搜索功能一度暂时停止服务。

这也表明，“小力出奇迹”或许可以大幅节约模型训练的成本，但在模型投入使用后，必要的基础设施成本仍然无法压减。

从商业角度来看，AI大模型注定是一门规模越大、能力越强、成本越高的生意。巨头们坚守“尺度定律”，其根基——算力、算法和数据三角模型依然稳固。

在DeepSeek崛起过程中，一个被不少人忽视的问题是，R1推理性能与o1不相上下，但在许多基准测试中不如o1。而箭在弦上的o3“满血版”，综合性能远超o1。和同期其他对手相比，比如谷歌的Gemini 2.0 Flash，R1也并非全面领先，而是与对手各擅胜场。

在专业人士眼中，R1的真正价值是，通过多种技术创新——比如强化学习、GRPO算法框架、DeepSeek MOE等，再加上优秀的工程思想，以较低成本在部分指标接近或超越了行业最强大模型。DeepSeek的“小力出奇迹”固然惊艳，但从来不是性能最强的大模型。

OpenAI刚发布的o3-mini，在许多测试中已经反超R1，也让国外巨头继续狂砸钱有了更坚实的证明。这表明，除了优秀的人才、出色的算法外，强大的算力、丰富的数据，也是构建更强大模型，乃至通往AGI的必经之路。

DeepSeek“小力出奇迹”证明了AI大模型的另一条发展路径，却并非是唯一的路径。手握重金的科技巨头，依然是AI大模型的主要参与者，同时也是DeepSeek继续上攻的强大对手。

AI大模型远未分出胜负，DeepSeek及其拥趸不能“半场开香槟”。而高性价比路线与“大力出奇迹”路线之争，也仍将持续下去，并在互相借鉴和融合中，推动AI大模型迈向下一个发展阶段。

精彩视频

点击观看

DeepSeek劝不了谷歌们

正文

请到「今天看啥」查看全文