DeepSeek出圈的意义！

研讯社 · 公众号 · · 2025-01-26 19:58

正文

为百万财经人士 倾心打造的投研资讯平台

为您解析宏观及政策、研判产业格局及动态，
与君共同见证中国资本市场的壮阔奋进时代！

——研讯社

周末，DeepSeek再次出圈。

起因是1月20日，量化巨头幻方量化旗下大模型公司DeepSeek正式发布推理大模型DeepSeek-R1，然后近日最新评测的一些数据超预期，在国外大模型排名榜Chatbot Arena上，DeepSeek-R1的基准测试排名已经升至全类别大模型第三，与OpenAI的ChatGPT-4o最新版并列，并在风格控制类模型（StyleCtrl）分类中与OpenAI的o1模型并列第一。

并且在DeepSeek去年12月26日推出V3（对标4o），以及1月20日推出R1（对标o1）后， DeepSeek官网流量增长迅速，从12月26日的44万涨至1月21日的420万，增长了约十倍，目前网页端用户已超过豆包和Kimi，并且总体海外占72.1%，美国用户占比5.36%。

DeepSeek出圈的几个意义：

第一层，对DeepSeek来说，这次的出圈将大幅提升自身流量，对DeepSeek产业链式利好，类似之前的月之暗面-Kimi。

第二层，对AI发展来说，又是一个重要的里程碑事件，DeepSeek的开源+高性价比，将推动全球AI加速从训练进入推理时代。

一方面，D eep Seek-R1是开源模型，支持免费商用、任意修改和衍生开发等。图灵奖得主、Meta首席人工智能科学家LeCun最新表示，DeepSeek之所以这次一鸣惊人，是因为他们从开放研究和开源中获益。开源模型正在超越专有模型。开源模型更利于后续的普及推广。

另一方面，DeepSeek使用模型蒸馏技术使得训练提效，模型蒸馏是一种将大型复杂模型（教师模型）的知识迁移到小型轻量模型（学生模型）的技术，旨在保留高性能的同时降低计算成本和资源需求。其核心思想是通过模仿教师模型的输出分布（软标签）或中间特征，使学生模型学习到泛化能力和推理逻辑。

DeepSeek 用更少的算力实现更复杂的任务，使得大模型不再局限于互联网巨头，将有更多的玩家可以参与进来，大模型真正实现大众化，万众创新、万众大模型，加速应用、端侧的普及。

周末还有一些声音在讨论DeepSeek是不是利空算力，其实这些都不重要了，因为AI正在加速进入推理时代，整个AI应用将迎来爆发，就像新能源汽车即将爆发的时候，就不要去抠这个锂电技术是不是会减少锂的用量了。

需要关注的是AI正在从训练到推理，从算力到应用。

第三层，对于国产AI来说，这次DeepSeek体现出国内大模型正在快速追赶海外大模型，尽管仍有较大差距，但这个差距正在缩小，大幅提振了国产大模型以及整个人工智能产业链发展的信心。

DeepSeek出圈的意义！

正文

请到「今天看啥」查看全文