1/10的算力，性能翻倍？10篇报告全面了解DeepSeek的效率革命

发现报告 · 公众号 · · 2025-02-06 10:00

正文

⚙️ 内燃机效率的提高，一定会带来更大的石油消耗。

过年前后，一个“来自东方的神秘力量”引发全球资本市场和AI圈震荡。

DeepSeek，让英伟达股价下跌16.97%，市值一日内蒸发近6000亿美元，创美国历史上任何一家公司的单日最大市值损失。此外，人工智能领域的衍生品，比如电力供应商也受到重创，美国联合能源公司股价下跌21%，Vistra的股价下跌29%。

DeepSeek的最新突破，动摇了美国科技行业的地位，引发全球关注。

DeepSeek是什么？与之前的AI大模型相比有哪些创新？后续会有哪些影响？报告酱梳理了10篇报告，我们来看看这个AI超牛战神。私信【0206】领取全部参考报告。

DeepSeek

DeepSeek成立于2023年7月，由知名量化资管巨头幻方量化创立，梁文锋是DeepSeek的创始人，他从始至终都表明“这一波浪潮里，我们的出发点，就不是趁机赚一笔，而是走到技术的前沿，去推动整个生态发展。”

一年多，模型已然迭代多个版本，目前模型能力可比肩OpenAI o1-mini。

从下载量来看，根据AI产品榜数据显示，DeepSeek成为全球增速最快AI应用，上线20天日活突破2000万。

根据Appfigures的数据显示（不包括中国的第三方应用商店），DeepSeek App于1月26日登上苹果App Store全球下载榜榜首。
根据Sensor Tower的研究，该应用在谷歌Play商店美国区下载排行榜中位居榜首。Sensor Tower数据显示，DeepSeek在发布的前18天内累计下载量达1600万次。

DeepSeek是搅动全球模型市场的一条鲶鱼，带来了性能、价格、开源三重冲击。

性能比肩国际顶尖模型：DeepSeek R1在数学、代码、自然语言推理等任务上的性能可比肩OpenAI o1模型正式版。在AIME2024数学基准测试中，DeepSeek R1得分率为79.8%，OpenAI o1的得分率为79.2%；在MATH-500基准测试中，DeepSeek R1得分率为97.3%，OpenAI o1的得分率为96.4%。
低成本颠覆市场格局：DeepSeek V3整个训练过程仅用了不到280万个GPU小时，相比之下，Llama3405B的训练时长是3080万GPU小时。DeepSeek V3的训练成本仅为约557.6万美元，而GPT-4等模型的训练成本则高达数亿美元。DeepSeek API服务定价远低于OpenAI，以输出为例，每百万输出tokens16元（约2.2美元），GPT o1每百万输出tokens60美元。
践行开源理念：DeepSeek V3和推理模型DeepSeek R1均开源，R1同步开源了其模型权重，并允许用户利用模型输出，通过模型蒸馏等方式训练其他模型。

创新之处

正如上文所说，DeepSeek最强大的地方在于降低了行业成本，另外，对国内大模型来说，更适合中国企业的口味。

首先，DeepSeek在算法上进行了相应的优化，使得训练成本大幅降低。以前如果说OpenAI是“大力出奇迹”，如今DeepSeek则是“小力也可以出奇迹”——小的算力用新的方法也能创造奇迹。其新模型DeepSeek R1以十分之一的成本达到了GPT o1级别的表现。

DeepSeek V3算力成本降低的原因有两点。

第一，DeepSeek V3采用的DeepSeek MoE是通过参考了各类训练方法后优化得到的，避开了行业内AI大模型训练过程中的各类问题。
第二，DeepSeek V3采用的MLA架构可以降低推理过程中的kv缓存开销，其训练方法在特定方向的选择也使得其算力成本有所降低。

第二点，DeepSeek在AI Agent的生产环节中，中文能力显著更强。DeepSeek-V3与Qwen2.5-72B（通义千问）在教育类测评C-Eval和代词消歧等评测集上表现相近，但在事实知识C-SimpleQA上更为领先。

具体来看，DeepSeek在成语、古文和专业术语的理解上进行了专项优化，让它更适合中文用户的使用需求。

AI Agent开发中有无数环节需要模型自动生成、执行代码，开发者最重视的是：模型能不能正确理解prompt中的细节，并且给出结构稳定的输出。

同样一个长度的prompt，很多情况下，GPT 4o无法抓到重点给出正确的输出，DeepSeek却可以做到正确的输出，业内人士称之为“这真是应用开发者的aha时刻”。

后续影响

DeepSeek的出现，让全世界看到AGI的实现又更近了一步，也给全球科技巨头进一步上紧发条。

一方面，巨头们对英伟达GPU的采购力度可能会进一步加大。DeepSeek的阶段性胜利，将继续推动算力市场的整体需求，长期的天花板进一步被打开，但英伟达的需求和订单并不会出现任何大幅度的影响，相反，可能会进一步超预期。另一方面，英伟达自身也会加速迭代，让产品性能得到更大提升，各大巨头也会加紧推进自研ASIC方案的进度。

此外，美国政府可能会进一步加紧芯片出口限制，试图在算力层面上进行最后的封锁，以限制其他国家地区的AI发展。

对于“星际之门”（Stargate）的投资逻辑也将有所影响。1月21日，特朗普在白宫宣布了名为"星际之门"的庞大AI基础设施计划，预计在未来四年内投资5000亿美元，用于建设支持AI发展的基础设施。这一计划由OpenAI、软银集团和甲骨文公司联手打造，旨在确保美国在全球AI竞争中的领先地位。特朗普表示，该项目将"几乎立即创造10万个美国就业岗位"，并为全球带来巨大的经济效益。

DeepSeek出现之前，科技巨头采取的是“不惜一切代价建设”的策略，即通过大规模资本开支，提高算力，从而获得更好的模型。但DeepSeek的出现可能导致市场质疑科技巨头大规模资本开支的合理性，“星际之门”落地的难度或将进一步加大，大概率上将难以如期完成。

对于全球算力投资的影响来说，无论是训练还是推理的角度，DeepSeek的出现都是积极的。GPU的优势非常明显，算力长期来看依旧将继续指数级增长，机构们不仅看好英伟达在AI基础设施领域的确定性优势，同时看好其在能够大幅度提升性能的新技术领域的加速，例如CPO、OIO的加速落地。

对于我国算力投资的影响来说，DeepSeek的推出，会让我们国产算力自主可控的飞轮开始旋转，还会拉动边缘侧的算力加速发展。

第一是云端先进模型的价格降低，使得AI应用，AI硬件的使用和开发运营成本降低，这将促进AI硬件的放量。
第二是DeepSeek对于小模型优化的能力，此次Deepseek也基于Qwen与Llama发布了部分优化后的小模型，能力相较于此前小模型有一定提升。

春节期间，华为云、微软、英伟达、AWS等厂商均已上线DeepSeek的模型服务。随着基础设施的能力提升和成本下降，我们将看到应用侧的百花齐放。除了DeepSeek，豆包、Qwen、Kimi等近2月都在快速升级迭代，月活提升，成本降低。

展望2025年，预计B端应用将最先迎来AI Agent，B端应用有成熟的数据、场景，例如客服、营销类场景会较快布局活跃有效的智能代理服务。其次，随着低参数模型性能翻倍，将更适用于追求低能耗的端侧AI创新产品。

具体标的可以参考机构给出的建议：

AI应用：金山办公、科大讯飞、焦点科技、彩讯股份、泛微网络、鼎捷数智、汉得信息、致远互联等。港股：迈富时、金蝶国际、明源云等；
AI端侧：中科创达、虹软科技、中兴通讯、润欣科技、乐鑫科技、兆易创新、移远通信、恒玄科技。

1/10的算力，性能翻倍？10篇报告全面了解DeepSeek的效率革命

正文

请到「今天看啥」查看全文