专栏名称: 卢松松
这才是正牌卢松松的公众号,每天推送有技术含量的文章,没事来看看。
目录
相关文章推荐
福州日报  ·  寒潮来袭!福建今天有雪,福州气温降至个位数 ·  21 小时前  
福州日报  ·  寒潮来袭!福建今天有雪,福州气温降至个位数 ·  21 小时前  
福州日报  ·  春节这八天,福州成“顶流”! ·  2 天前  
福州日报  ·  春节这八天,福州成“顶流”! ·  2 天前  
福州新闻网  ·  随处可见!“感觉江浙沪粤人民集体来福州” ·  4 天前  
福州新闻网  ·  随处可见!“感觉江浙沪粤人民集体来福州” ·  4 天前  
福州日报  ·  延长至2月28日!福州重要通知 ·  4 天前  
51好读  ›  专栏  ›  卢松松

难怪Deepseek创始人受到总理接见,还上了新闻联播

卢松松  · 公众号  ·  · 2025-01-27 08:05

正文


Deepseek恐怕做梦都没料到,
一个业余的AI团队,转眼间竟已与 华为 、TikTok 比肩齐名了 。这家成立于2023年的的AI公司Deepseek先是在外网火了,许多人预言: Deepseek很可能会戳破美国史上最大的AI泡沫。
这两天,总理邀请 Deepseek 创始人梁文锋参加座谈会,相关报道更是登上《新闻联播》,一时间引发广泛关注。
(图为梁文锋参加座谈会)
然后微软总裁纳德拉、扎克伯格、连OpenAI的创始人奥特曼都在称赞Deepseek。甚至整个美国的AI圈都在研究Deepseek发布的V3和R1大模型。
扎克伯格更直接:他呼吁美国政府加紧封锁中国AI技术,还说Deepseek威胁美国国家安全,他要求所有AI员工上阵研究Deepseek的大模型。
扎克伯格很着急,因为支撑Meta 公司股价的就是独霸市场的开源‌LLaMA模型,这个模型投入已经超过1000亿美元,本来还打算在投入650亿美金做护城河,结果Deepseek只用了Meta 公司一个高管的工资就能做出超过他们几年上千亿美金研发出开源的‌LLaMA模型。
最主要的是人家的主业是干“量化交易”的,后面 干了个 副业AI大模型出来 ,竟然威胁到美国的国家安全了。你说扎克伯格能不急嘛!!!
Meta 公司原本是想通过开源的‌LLaMA模型,大规模掌控全球商业公司,甚至他可以通过AI技术决定每个公司的生产力水平,让他的开源模型成为AI时代的水和电。
而Deepseek出来后,扎克伯格直接傻眼了,它不仅让英伟达的股价下跌了,还有可能刺破美国史上最大的AI泡沫。
因为Deepseek改变了整个AI大模型的研发模式,Deepseek出来后,只用了少量芯片和不到600万美金就训练出来了,媲美chatgpt O1的模型,成本下降了10倍,效果却不输顶尖的大模型。
这样一来,以后 大家对算力的要求降低了太多了 ,据说AMD已经把Deepseek打包到AMD的解决方案里面了。
以前所有的公司都认为AI大模型需要大力出奇迹,需要对算力进行大量的投资,购买大量芯片,而Deepseek改变了这一认知。老外总是想着问题复杂化,而中国人总是化繁为简。
最最重要的是:Deepseek是按照MIT协议、完全开源的模型,从代码到架构,从理论到训练方法,您随便看随便改随便用。现在全球多个团队,宣布复现了R1的训练过程。
报道说后来研究人员发现,Deepseek稍微深一些的推理仍然不如西方吃算力的大模型,只是某些场景推理能力省算力。

写在最后

DeepSeek最大的意义是, 低成本戳破美国AI的资本泡沫游戏,让AI回归科研本身 ,开源打破美国的模型壁垒,让全世界都可以参与AI研发。
难怪DeepSeek的老板受到总理接见,还上了新闻联播。
扩展阅读:
DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,2025年1月20日,DeepSeek正式发布 DeepSeek-R1 模型,并同步开源模型权重。创始人梁文锋毕业于浙江大学人工智能专业,曾从事量化投资,后转型AI技术。
相关阅读:
争光了!中国AI大模型全球排名第一
117个AI大模型备案了
老美AI大模型不让我们用了
吐槽3家知名的AI智能体






请到「今天看啥」查看全文