周末，爆火的消息！

南山之路 · 公众号 · · 2025-01-26 22:44

正文

周末，Deepseek爆火出圈，幻方量化旗下的大模型公司DeepSeek发布大模型DeepSeek-R1，在IOS排行榜的中国和美国区域，同时进入第4名。

在国外大模型排名榜Chatbot Arena上，DeepSeek-R1的基准测试排名已经升至全类别大模型第三，与OpenAI的ChatGPT-4o最新版并列，并在风格控制类模型（StyleCtrl）分类中与OpenAI的o1模型并列第一。

老美主流媒体纽约时报1月24日报道：“中国AI初创公司DeepSeek发布的AI系统性能可与OpenAI等公司的尖端产品相媲美，而其使用的芯片数量远少于硅谷同行。这让人们对美国政府对华贸易限制的效果产生了质疑。”

谷歌前CEO施密特说，真是没想到，中国的AI科技，能 这么快就追赶上美国的水平 。

D eepseek持续发酵，主要是它的算法很牛，只用极低的硬件成本，表面上就实现了接近 O penAI 的效果，而且不同于 O penAI以及其他美国巨头搞闭源， D eepseek的代码全部开源，这是最牛的。

D eepseek成本有多低呢？一共只使用了2000张GPU，花费280万GPU小时训练，合计成本不到600万美金。

相比之下，Meta的Lama3模型了使用了1.6万张GPU，花费了3930万GPU小时，耗资数亿美金。

Meta的AI部门，年薪超过500万美元的就有好几十位...

Deepseek的低成本训练引发了海外Meta，谷歌和OpenAI的恐慌，这些厂商砸了几百亿美金开发AI模型，做出来的大模型跟国内厂商花几百万美金的效果差不多，没法向投资人交代了...

Meta员工发帖称：Meta内部因为DeepSeek的模型，进入了恐慌模式。

CNBC针对 DeepSeek专门做了一期访谈，其中有段话是，“如果一个AI大模型，又便宜又好用，还开源，那全世界的开发者都会使用它，这给了 中国成为AI核心基础设施提供者的机会 ，而这对美国而言，是完全无法接受、也是必须要避免的局面。”

Mistral AI董事会成员米德哈表示：“从斯坦福到麻省理工，DeepSeek R1几乎一夜之间成为美国顶尖大学研究人员的首选模型。

DeepSeek 的成功意味着，中美在AI领域的差距并没有拉大，国内大模型正在快速追赶海外大模型，尽管仍有较大差距，但这个差距正在缩小，大幅提振了国产大模型以及整个人工智能产业链发展的信心。

随着模型训练的持续深入，算力对模型效果的影响正在逐步减弱，对算力产业链，至少短期来说不是好消息。

英国主流媒体《经济学人》评论： DeepSeek的出现并且彻底开源，动摇了硅谷这些年以来形成的，通过资本加技术密集垄断科技前沿方向的逻辑，必然会推动全球范围内的技术民主化浪潮，推动技术的开放和中立，而中国占据了这个浪潮的发起者位置，被冲击者则是美国，会让美国陷入两难的境地。

DeepSeek R1的出现，最受益的方向自然是相关的概念公司，长期非常利好AI应用、人型机器人、自动驾驶，后两者实际上也是AI赋能。

--------

这几天有亲友结婚，一直帮忙折腾这事，酒席是在农村老家办的，琐碎的礼节可真多，随便某些细节招待不周就可能引发双方的不愉快，鉴于目前婚嫁市场是女方主导，所以主要是男方家庭照顾女方的礼节。

我们湖北又是出了名的礼节繁杂，据说本村和隔壁村的礼仪习俗，就可能大有不同。

这次亲友结婚，男女双方家庭提前好几个月就开始沟通诸般事宜，可见兹事体大。