专栏名称: 研讯社
研讯社(原名研报社),是为百万财经人士倾心打造的研究报告及资讯平台——为您解析宏观及政策、研判产业格局及动态,与君共同见证中国资本市场的壮阔奋进时代!
目录
相关文章推荐
纪念币预约信息  ·  开始预约!龙凤和鸣银条纪念章!可佩戴! ·  15 小时前  
51好读  ›  专栏  ›  研讯社

DeepSeek出圈的意义!

研讯社  · 公众号  ·  · 2025-01-26 19:58

正文

为百万财经人士 倾心打造的投研资讯平台



为您解析宏观及政策、研判产业格局及动态,
与君共同见证中国资本市场的壮阔奋进时代!

——研讯社


周末,DeepSeek再次出圈。

起因是1月20日,量化巨头幻方量化旗下大模型公司DeepSeek正式发布推理大模型DeepSeek-R1, 然后近日最新评测的一些数据超预期,在国外大模型排名榜Chatbot Arena上,DeepSeek-R1的基准测试排名已经升至全类别大模型第三, 与OpenAI的ChatGPT-4o最新版并列, 并在风格控制类模型(StyleCtrl)分类中与OpenAI的o1模型并列第一。

并且在DeepSeek去年12月26日推出V3(对标4o),以及1月20日推出R1(对标o1)后, DeepSeek官网流量增长迅速,从12月26日的44万涨至1月21日的420万,增长了约十倍, 前网 页端用户已超过豆包和Kimi,并且总体海外占72.1%,美国用户占比5.36%。

DeepSeek出 圈的几个意义:

第一层,对DeepSeek来说,这次的出圈将大幅提升自身流量, 对DeepSeek产业链式利好,类似之前的月之暗面-Kimi。

第二层, 对AI发展来说,又是一个重要的里程碑事件,DeepSeek的开源+高性价比,将推动全球AI加速从训练进入推理时代。

方面,D eep Seek-R1是开源 模型,支持免费商用、任意修改和衍生开发等。图灵奖得主、Meta首席人工智能科学家LeCun最新表示,DeepSeek之所以这次一鸣惊人,是因为他们从开放研究和开源中获益。开源模型正在超越专有模型。开源模型更利于后续的普及推广。

另一方面,DeepSeek使用模型蒸馏技术使得训练提效,模型蒸馏是一种将大型复杂模型(教师模型)的知识迁移到小型轻量模型(学生模型)的技术,旨在保留高性能的同时降低计算成本和资源需求。其核心思想是通过模仿教师模型的输出分布(软标签)或中间特征,使学生模型学习到泛化能力和推理逻辑。

DeepSeek 用更少的算力实现更复杂的任务,使得大模型不再局限于互联网巨头,将有更多的玩家可以参与进来,大模型真正实现大众化,万众创新、万众大模型,加速应用、端侧的普及。

周末还有一些声音在讨论DeepSeek是不是利空算力,其实这些都不重要了,因为AI正在加速进入推理时代,整个AI应用将迎来爆发,就像新能源汽车即将爆发的时候,就不要去抠这个锂电技术是不是会减少锂的用量了。

需要关注的是AI正在从训练到推理,从算力到应用。

第三层, 对于国产AI来说,这次DeepSeek体现出国内大模型正在快速追赶海外大模型,尽管仍有较大差距,但这个差距正在缩小,大幅提振了国产大模型以及整个人工智能产业链发展的信心。






请到「今天看啥」查看全文