专栏名称: 智能涌现
直击AI新时代下涌现的产业革命。36氪旗下账号。
目录
相关文章推荐
江苏新闻  ·  深夜暴发!突然大涨! ·  昨天  
海峡都市报  ·  最新通报:涉事员工开除! ·  2 天前  
海峡都市报  ·  最新通报:涉事员工开除! ·  2 天前  
51好读  ›  专栏  ›  智能涌现

DeepSeek火了,淘金者失落,卖铲者狂欢

智能涌现  · 公众号  · 科技自媒体  · 2025-03-11 18:13

主要观点总结

本文介绍了亚马逊云科技推出的全托管、无服务器的DeepSeek-R1模型在国外的市场表现和用户反馈,以及其给行业带来的影响和产生的价值。

关键观点总结

关键观点1: DeepSeek-R1模型成为海外云厂商首个正式商用模型

DeepSeek-R1作为首个登陆Amazon Bedrock的国产大模型,自上线以来已有数千客户通过Amazon Bedrock的自定义模型导入功能部署了DeepSeek-R1模型。其推出引起了全球市场的广泛关注,引发了企业自研大模型的竞争。

关键观点2: DeepSeek-R1模型的市场反响和对企业的影响

市场的反应与初期形成鲜明对比,反映出DeepSeek的重要性。DeepSeek不仅探索出强化学习大模型的多种可能性,且全面的开源让所有人都能站在其肩膀上继续创新。然而,这也引发了企业自研大模型的竞争,许多企业面临成本高昂和用户活跃度不高的问题。

关键观点3: 大模型竞争的现状和未来的发展趋势

当前大模型竞争依然激烈,各家企业纷纷寻求创新以脱颖而出。云计算巨头也在积极参与其中,通过提供前沿模型服务来争夺市场份额。大模型技术的下一次颠覆性突破可能来自任何国家,任何企业甚至初创公司之间都存在可能性。

关键观点4: 云计算厂商在大模型时代的战略选择

云计算厂商在大模型时代的战略思路是提供多种模型选择,满足企业在云上多模型策略的需求。因为无论出于安全、成本还是复杂业务适配性的角度,云上多模型策略都是企业的最优选择。此外,云计算厂商也在积极参与大模型的研发和生产,以抓住AI领域的商业机遇。

关键观点5: 大模型的商业价值落地和未来的前景

大模型的商业价值正在逐渐落地,未来将有更多企业利用大模型实现商业价值。互联网和云计算基础设施的发展为大模型的广泛应用奠定了基础,未来大模型将成为各行各业的基础设施。


正文

图片

裁员、收缩、高管动荡,企业烧不出一张“大模型船票”。

智能涌现

今天凌晨,亚马逊云科技宣布在Amazon Bedrock平台上推出全托管、无服务器的DeepSeek-R1模型,是首个提供DeepSeek-R1作为全托管、正式商用模型的海外云厂商。所以,对于出海企业而言,Deepseek on Bedrock是一个绝佳的选择。另一方面,作为首个登陆Amazon Bedrock的国产大模型,DeepSeek自今天1月底上线以来,已有数千客户通过Amazon Bedrock的自定义模型导入功能部署了DeepSeek-R1模型。

2025春节以来,全球最火的话题,莫过于DeepSeek。

年初,DeepSeek-R1论文横空出世,几乎以闪电般的速度血洗“百模大战”。

海外“科技七姐妹”应声巨跌,将美国三大股指砸出一个深坑;国内AI大模型玩家几乎集体“熄火”,广告投放收缩首当其冲,团队裁减与高管动荡也不在少数。

市场的反应与2022年11月底形成鲜明对比。彼时,ChatGPT同样“横空出世”,却引发了全球科技产业的狂欢,海内外科技股股价狂飙,巨资涌入“百模大战”,烧出了一片红红火火。

如今DeepSeek面世,不仅为强化学习的大模型路径探索出了无数的可能性,更是毫无保留地全面开源,让所有人都能“站在DeepSeek的肩膀上”继续创新,这少说也能算得上是行业的“阿尔法狗”时刻(AlphaGo Zero正是靠强化学习打败人类围棋冠军柯洁),怎么市场反应竟如此悲观?

事实上,DeepSeek的火爆、市场的悲观、以及竞争对手们的种种反应,都只是结果,而非出现这些现象的原因。

真相是,企业自研大模型,已经越来越“无利可图”。

烧不出一张“大模型船票”

就在前不久的3月1日,DeepSeek官方披露,按照DeepSeek-R1的token定价水平,公司一日之内总收入为562027美元,成本利润率高达545%。

一个让绝大多数大模型玩家感到绝望的数字。

一边是高昂的研发成本,重金聘请的博士、博士后、首席科学家;另一边却是低靡的日活用户,ROI不成正比的巨额投放。越来越多企业烧不出一张“大模型船票”。

可与之相对应的,是日益惨烈的大模型竞争。

根据AppGrowing数据,截止至2024年11月,Kimi、豆包、星野、元宝等国内十款AI应用合计投放广告数量超过625万条,换算金额超过15亿元——其中,月之暗面最为激进,其累计投放超过5.4亿元。

然而,DeepSeek一夜之间将所有竞争对手打懵,根据非凡产研数据,截止至2025年2月5日,DeepSeek移动端日活用户已突破4000万人,当日ChatGPT移动端日活为5495万,DeepSeek已达到ChatGPT的74.3%。

根据The Information、华尔街日报等外媒消息,OpenAI正与投资者洽谈新一轮融资,其融资金额最高可达400亿美元(约2900亿元人民币)。

在这个融资的当口,谁是OpenAI CEO都得急得天天发推特。

截止至2025年2月5日ChatGPT与DeepSeek移动端DAU日活数据对比,图片来源:非凡产研

强敌当前,阿里、百度、腾讯等国内竞争对手纷纷向DeepSeek抛出橄榄枝,“满血版DeepSeek”一时间成了互联网最新流量密码。

其中,腾讯做法最为激进,不同于竞争对手在云计算服务层面接入DeepSeek,腾讯直接将DeepSeek接进了自家AI应用“元宝”中,使其一跃成为中国区苹果应用商店免费APP下载榜第二,甚至一度超越长期占据榜首的DeepSeek,成为第一。

在最近一次接受媒体采访时,金沙江创投主管合伙人朱啸虎一改往日对AGI的不信任,重新表态说:“DeepSeek快让我相信AGI了。”

此外,他再次强调:“创业公司千万别去做底层模型,就在上面抓住用户,抓住场景……随着底层模型进步,用最好的、最新的模型就行了。 ”

这一观点听着刺耳,略显偏颇,但也许对于有些企业来说,并非毫无道理。

大模型竞赛,已经走入下一个阶段。

淘金者与卖铲人

与大模型企业洗牌形成鲜明对比的,是全球企业AI需求的飙升,以及各大售卖AI大模型服务的云计算巨头们拿出的亮眼业绩。

根据最新一季财报数据,谷歌云2024Q4营收为119.55亿美元,同比增长达30%,谷歌表示,这一增长主要得益于谷歌云平台的核心产品、AI基础设施和AGI(生成式人工智能)解决方案的强劲表现。

微软智能云业务最新一季度营收255.4亿美元(包括Azure),同比增长19%;Azure和其他云服务收入增长31%,其中13%的营收来自AI相关业务(Azure具体收入数据未披露)。

全球云老大亚马逊云科技在2024Q4的收入为288亿美元,连续第二个季度实现同比19%的收入增长,亚马逊总裁兼首席执行官Andy Jassy在在分析师电话会议上表示,对亚马逊云科技云服务将支撑全球大部分AI工作负载持乐观态度。

全球云巨头市场份额占比,图片来源:Synergy Research Group

而且,一个更有趣的现象是,年初,当DeepSeek搅动全球市场时,亚马逊云科技、微软Azure、英伟达NVIDIA NIM三家海外企业于美国时间1月30日同日宣布上架或接入DeepSeek-R1模型,几天之后,百度云、阿里云等中国云厂商才陆续宣布接入。

尤其是亚马逊云科技,这种第一时间接入最新、最强模型的玩法,已经不是第一次了。

早在2024年3月,Claude 3系列模型“新皇出世”,在各项数据上碾压GPT-4时,亚马逊云科技就第一时间在Amazon Bedrock中上架了Claude 3。

同样的故事发生在DeepSeek,也发生在Meta Llama、Stability AI、Mistral AI等等模型上。根据官方数据,当前亚马逊云科技的Amazon Bedrock平台已经搭载了180多个基础模型供客户选择,在云平台上打起了真正的“百模大战”。

亚马逊云科技的这套玩法跟它一直以来在大模型领域的“Choice Matters”(选择大于一切)战略一脉相承。

放眼全球,虽然同为云计算巨头,但各家玩法不同:

微软自不必说,巨资押宝OpenAI之余,Azure OpenAI服务还独家支持OpenAI模型。2024年,微软与法国Mistral AI建立分销合作并投资持股,进一步扩展欧洲市场。同时,微软手握Office办公室套件这一大杀器,Copilot智能助手也成为了云AI办公场景的天然统治区。

谷歌是AI时代的老牌巨头,大模型本轮技术创新的神级论文《Attention is All you Need》正是出自谷歌之手。谷歌云在大模型领域倾向于首推自家Gemini家族,在跨文本、图像、音频、视频的多模态与联合推理方面表现不俗。

既淘金,也卖铲子。

而作为云计算的开创者、迄今为止云计算领域的头部玩家,亚马逊云科技则热衷于扩大可供客户选择的前沿模型数量,比如上文提到的DeepSeek、Llama、Mistral等等。此外,亚马逊还于2023年底、2024年年底分别向Anthropic重金投资,总投资额达到80亿美元;亚马逊云科技还于去年年底re:Invent 大会上发布了王炸级别的多模态、高性价比自研模型Amazon Nova。

事实上,亚马逊云科技在大模型时代的战略思路,一直更坚定地偏向“卖铲子”。

这一战略是市场教给他们的。

根据Jefferies & Company报告数据,当前,只有3%的企业只使用一个语言模型提供商,而34%的企业使用两个,41%的企业使用三个,22%的企业使用四个。根据Gartner的预测数据,到2027年,80%的中国企业将会选择多模型策略。

对于企业来说,保证其在云上多模型的选择权,极其重要。

一方面,无论是出于安全、成本、还是复杂业务适配性的角度,云上多模型策略对于企业来说都会是最优选;

另一方面,从更深远来说,本轮生成式AI所带来并不仅仅是生产工具的迭代,而可能是一场触达商业模式本质的变化。企业决策者最关心的是生成式AI所带来的商业增长和商业价值,无论是DeepSeek、Claude,还是Nova或是Gemini,都是帮助企业实现商业价值中的一环,而非全部——亚马逊云科技所制定的“Choice Matters”(选择大于一切)战略正是指向于此,只有能给企业带来实质商业价值的生成式AI才有意义。

大模型从2022年底爆发以来,已经走过了两年半的历程,如果说2023年是大模型验证之年,2024年是大模型产品之年,那么2025年,将会是大模型商业价值落地的一年。

变数

除了成本、安全、商业价值之外,企业所看重的“云上选择权”,还有一个重要的原因:当前的大模型行业里,依旧存在大量变数。







请到「今天看啥」查看全文