周末
,Deepseek爆火出圈,幻方量化旗下的大模型公司DeepSeek发布大模型DeepSeek-R1,在IOS排行榜的中国和美国区域,同时进入第4名。
在国外大模型排名榜Chatbot Arena上,DeepSeek-R1的基准测试排名已经升至全类别大模型第三,与OpenAI的ChatGPT-4o最新版并列,并在风格控制类模型(StyleCtrl)分类中与OpenAI的o1模型并列第一。
老美主流媒体纽约时报1月24日报道:“中国AI初创公司DeepSeek发布的AI系统性能可与OpenAI等公司的尖端产品相媲美,而其使用的芯片数量远少于硅谷同行。这让人们对美国政府对华贸易限制的效果产生了质疑。”
谷歌前CEO施密特说,真是没想到,中国的AI科技,
能
这么快就追赶上美国的水平
。
D
eepseek持续发酵,主要是它的算法很牛,只用极低的硬件成本,表面上就实现了接近
O
penAI
的效果,而且不同于
O
penAI以及其他美国巨头搞闭源,
D
eepseek的
代码全部开源,这是最牛的。
D
eepseek成本有多低呢?一共只使用了2000张GPU,花费280万GPU小时训练,合计成本不到600万美金。
相比之下,Meta的Lama3模型了使用了1.6万张GPU,花费了3930万GPU小时,耗资数亿美金。
Meta的AI部门,年薪超过500万美元的就有好几十位...
Deepseek的低成本训练引发了海外Meta,谷歌和OpenAI的恐慌,这些厂商砸了几百亿美金开发AI模型,做出来的大模型跟国内厂商花几百万美金的效果差不多,没法向投资人交代了...
Meta员工发帖称:Meta内部因为DeepSeek的模型,进入了恐慌模式。
CNBC针对
DeepSeek专门做了一期访谈,其中有段话是
,“如果一个AI大模型,又便宜又好用,还开源,那全世界的开发者都会使用它,这给了
中国成为AI核心基础设施提供者的机会
,而这对美国而言,是完全无法接受、也是必须要避免的局面。”
Mistral AI董事会成员米德哈表示:“从斯坦福到麻省理工,DeepSeek R1几乎一夜之间成为美国顶尖大学研究人员的首选模型。
DeepSeek
的成功意味着,中美在AI领域的差距并没有拉大,
国内大模型正在快速追赶海外大模型,尽管仍有较大差距,但这个差距正在缩小,大幅提振了国产大模型以及整个人工智能产业链发展的信心。
随着模型训练的持续深入,算力对模型效果的影响正在逐步减弱,对算力产业链,至少短期来说不是好消息。
英国主流媒体《经济学人》评论:
DeepSeek的出现并且彻底开源,动摇了硅谷这些年以来形成的,通过资本加技术密集垄断科技前沿方向的逻辑,必然会推动全球范围内的技术民主化浪潮,推动技术的开放和中立,而中国占据了这个浪潮的发起者位置,被冲击者则是美国,会让美国陷入两难的境地。
DeepSeek R1的出现,最受益的方向自然是相关的概念公司,长期非常利好AI应用、人型机器人、自动驾驶,后两者实际上也是AI赋能。
--------
这几天有亲友结婚,一直帮忙折腾这事,酒席是在农村老家办的,琐碎的礼节可真多,随便某些细节招待不周就可能引发双方的不愉快,鉴于目前婚嫁市场是女方主导,所以主要是男方家庭照顾女方的礼节。
我们湖北又是出了名的礼节繁杂,据说本村和隔壁村的礼仪习俗,就可能大有不同。
这次亲友结婚,男女双方家庭提前好几个月就开始沟通诸般事宜,可见兹事体大。