专栏名称: 21世纪经济报道
21君陪你度过经济、投资里的漫长岁月。
目录
相关文章推荐
闽南日报  ·  金价,大涨! ·  2 天前  
闽南日报  ·  金价,大涨! ·  2 天前  
数据宝  ·  持股过节,这两类资金买股清单来了! ·  4 天前  
陶博士2006  ·  250127 今年在哪过春节 ·  5 天前  
51好读  ›  专栏  ›  21世纪经济报道

DeepSeek,再曝大消息!

21世纪经济报道  · 公众号  · 财经  · 2025-01-31 22:37

主要观点总结

英伟达推出搭载DeepSeek-R1模型的软件服务,助力AI应用开发。DeepSeek-R1采用大规模专家混合(MoE)架构,拥有强大的推理能力。微软和AWS等科技巨头已经接入DeepSeek-R1模型,以强化自家的云业务。同时,DeepSeek的推出也给OpenAI等闭源代表带来竞争压力。特斯拉CEO马斯克对DeepSeek提出质疑,但也认识到其潜在价值并期待其在自动驾驶和机器人领域的发展潜力。

关键观点总结

关键观点1: 英伟达推出DeepSeek-R1模型服务。

英伟达上线了搭载DeepSeek-R1的软件服务,作为NVIDIA NIM微服务预览版提供,开发者可以测试和体验该API。

关键观点2: DeepSeek-R1模型的强大推理能力。

DeepSeek-R1采用大规模专家混合(MoE)架构,拥有高达6710亿的参数规模,强大的推理能力依赖于大规模的高算力GPU。

关键观点3: 科技巨头接入DeepSeek-R1模型。

微软和AWS等科技巨头已经接入DeepSeek-R1模型,强化自家的云业务,展现出对DeepSeek-R1模型的认可和对AI普及和爆发的期待。

关键观点4: DeepSeek对OpenAI等闭源代表带来的竞争压力。

DeepSeek的推出给OpenAI等闭源代表带来竞争压力,引发了AI赛场上的激烈竞争。

关键观点5: 特斯拉CEO马斯克的反应。

特斯拉CEO马斯克对DeepSeek提出质疑,但也认识到DeepSeek的价值和其在自动驾驶和机器人领域的潜力。


正文

作 者丨倪雨晴 郑植文

编 辑丨朱益民 吴晓宇 刘雪莹

视 频丨许婷婷 实习生黄楠


DeepSeek激起千层浪!



英伟达出手



1月31日,英伟达官宣,上线了搭载DeepSeek-R1的软件服务。英伟达的官网显示,DeepSeek-R1模型现已作为NVIDIA NIM微服务预览版提供,开发者可以测试和体验该API,未来提供可下载的NIM微服务版本。




什么是NIM服务?这是英伟达在2024年新推出的软件产品,主要助力AI应用开发。Forrester副总裁兼首席分析师戴鲲曾向21世纪经济报道记者表示,NIM是个推理平台,融合了底层的CUDA、对自身和第三方大模型的支持、对主流推理框架和云平台的集成,可以加速生成式人工智能模型推理全过程,是NVIDIA企业级AI平台的最后一块拼图。


英伟达当然是硬件巨头,更是软件专家,它也有自己的B端AI服务平台,NIM微服务主要是帮助开发者面向未来创造新的应用,不需要从零写代码。


所以,英伟达接入DeepSeek-R1也是丰富自家平台上的模型选项,然后和自家硬件相结合,形成一整套软硬件AI体系。结合NVIDIA AI Foundry和NVIDIA NeMo软件,企业还可定制DeepSeek-R1 NIM微服务,以构建特定领域的AI智能体。


R1作为推理模型,英伟达在介绍中着重强调了其强大的推理能力,并表示推理需要大量的算力支持。


英伟达解析道,DeepSeek-R1采用大规模专家混合(MoE)架构,参数规模高达6710亿,是许多流行的开源大模型的10倍。其输入上下文长度可达128000个Token,每层拥有256个专家(Experts),每个Token会被并行路由至8个不同的专家进行推理计算。


而要想实现R1的实时推理,需要大量高算力GPU,并依赖高带宽、低延迟的通信能力,将输入 Token高效路由至所有专家进行推理。结合NVIDIA NIM微服务的优化,一个配备8块H200 GPU并通过NVLink和NVLink Switch互联的服务器,即可运行完整的6710亿参数DeepSeek-R1模型,实现高达3872 Token/秒的推理吞吐量。




DeepSeek“真香”?



据@玉渊潭天 总结,这个春节,DeepSeek火爆全球,随着热度而来的还有白宫的国家安全调查,这一操作并不陌生,这段时间美国对华制裁可谓花样百出。但被白宫点名的这些企业,业绩非但没有下滑,有些产品反而越来越火。


视频来源:@玉渊潭天


事实上,科技巨头已经下场无缝连接DeepSeek-R1模型服务。


先是微软,现在已经将DeepSeek-R1模型添加到其Azure AI Foundry,开发者可以用新模型进行测试和构建基于云的应用程序和服务。同时,微软还将R1的精炼版本引入“Copilot+PC”,率先提供给搭载骁龙X芯片、英特尔酷睿Ultra 200V处理器的PC设备,然后是搭载AMD Ryzen AI 9的设备。(相关回顾:DeepSeek,突传大消息!


紧接着,AWS(亚马逊云科技)也宣布,用户可以在Amazon Bedrock和Amazon SageMaker AI两大AI服务平台上部署DeepSeek-R1模型。


从微软和AWS的选择和动作看,都在用更多、更强大的大模型矩阵,来强化自家的云业务。眼下云厂商正在加大AI转型力度,外界也最关注AI如何驱动云增长。


对于英伟达、AWS和微软三家巨头而言,不论“黑猫还是白猫”,能够上场应用的模型就是“好猫”。而大家迅速接入DeepSeek模型,一方面是认可DeepSeek的能力,另一方面大家的共识是AI成本在降低,都在为AI普及和应用爆发做更多基础布局。


从去年开始,业界大佬就不断强调成本下降这一观点,但各有各的逻辑。比如英伟达说AI推理成本下降,主要基于算力效率提高。现在,DeepSeek从算法角度给出了新的解题思路,通过工程创新提高训练和推理效率,进一步降低成本。


同时,DeepSeek也带给OpenAI、Anthropic两大闭源代表更大的竞争压力。这两家AI明星已经聚集了巨大资本,2024年都获得了大额融资。近日Anthropic CEO发文要求加强出口管制;OpenAI动作频频,不仅突然宣布“o3”模型要在周五公布,还有融资传闻流出。


据媒体报道,OpenAI正在以3000亿美元估值,寻求新一轮的400亿美元融资,还有报道称,软银此番计划最多向OpenAI投资250亿美元。这也和不久前推出的Stargate(星际之门)计划,有所呼应。


可以预见,AI赛场上,你追我赶的竞争态势愈演愈烈,DeepSeek刮起的旋风还将继续。表面上看,DeepSeek是一家小型初创企业,但它背后的幻方量化已经成长了近十年,公司招募的多是外人眼中的“天才少年”,精悍的团队让DeepSeek的叙事席卷全球。


人才,依然是创新的基石,AI继续吸引着全球最聪明的脑袋、最顶尖的人才投身其中。DeepSeek的“黑神话”拉开了AI新篇章,这或许是一个新起点,在AI开源世界中,更多的DeepSeek正在孕育中。同时,也让子弹多飞一会,让这场围绕着DeepSeek、成本、AI泡沫、开源闭源的探讨越辩越明。



质疑DeepSeek的马斯克,还得靠AI撑起特斯拉股价



面对DeepSeek的爆火,特斯拉CEO马斯克却在社交平台上嗤之以鼻,质疑其低成本训练,还附和“DeepSeek拥有5万块英伟达H100芯片”的言论。


在DeepSeek评论区高速冲浪的马斯克嗅到了一丝危机,但也尝到了甜头。


当地时间1月29日美股盘后,特斯拉发布2024年第四季度及全年业绩报告。报告期内,汽车业务营收、利润率、净利润、销量同比均有所下降,且不及市场预期。


不过,卖车并不是特斯拉的终极目的,正如特斯拉CEO马斯克多次强调,特斯拉是一家AI公司而并非汽车制造商。


在最近的财报会上,马斯克称,“特斯拉有朝一日将依靠自动驾驶车辆和人形机器人成为世界上最有价值的公司,远超其他公司,特斯拉的价值将远超过其后五大公司的总和。”(>>详情



SFC

本期编辑 刘雪莹

 21君荐读 

DeepSeek,突传大消息!


王宝强,冲上热搜!


“有钱都买不到”!多地爆满,网友:堪比春运现场