专栏名称: 城市进化论
探寻城市路径,揭秘经济逻辑
目录
相关文章推荐
51好读  ›  专栏  ›  城市进化论

DeepSeek开源第三弹:核心代码仅300行,榨干GPU!“宇宙最重要财报”明早来袭,英伟达能否顶得住?

城市进化论  · 公众号  ·  · 2025-02-26 23:48

正文

请到「今天看啥」查看全文



2月26日,DeepSeek宣布开源支持稠密和MoE模型的DeepGEMM(通用矩阵乘法)计算库,可为V3/R1模型的训练和推理提供强大支持。


图片来源:X


DeepGEMM最大的特点就是简洁高效,仅有300行核心代码。但在性能上,DeepGEMM的表现非常出色,在某些情况下甚至能够超越专家精心调优的计算库,可以说是极致榨干GPU的性能潜力。


据介绍,DeepGEMM库具有以下特征:


1.同时支持密集布局和两种MoE(混合专家模型)布局;

2.使用CUDA(统一计算架构)编写,无需编译即可安装;

3.完全即时编译,即用即跑;

4.专为NVIDIA Hopper张量核心设计;

5.使用CUDA核心两级累加解决FP8张量核心累加不精确的问题。


GEMM是线性代数中的基本运算,是科学计算、机器学习、深度学习等领域中最常见的计算操作,也是许多高性能计算任务的核心。简单来说,它计算两个数据表格(矩阵)相乘的结果。这看似简单,但在AI计算中,这些矩阵可能非常庞大,含有数百万个元素,使得矩阵乘法成为整个系统中最耗时的部分之一。


然而,这样的解释对于非专业人士而言,仍然不够通俗易懂。《每日经济新闻》记者让DeepSeek-R1模型用生活场景中的示例,把DeepGEMM讲得明明白白。


在DeepGEMM计算库开源的前一天,据外媒报道,DeepSeek计划提前发布其新一代AI模型R2。据知情人士透露,R2原定于5月初发布,但现在公司希望尽快推出。据悉,新模型将在编程能力和多语言推理方面有所提升。


此前,有行业人士在Reddit中发帖表示,“DeepSeek-R2将是一次优化飞跃,而不是算法飞跃。如果说DeepSeek证明了什么,那就是他们解决优化问题的能力。”


事实上,自2月21日DeepSeek官宣将启动“开源周”以来,英伟达股价一直“跌跌不休”,三个交易日(指的是21日、24日和25日)已经累跌近10%。


而美东时间周三(北京时间2月27日凌晨)美股盘后,英伟达还将公布2025财年第四季度财报。这份号称是“宇宙最重要的财报”也是今年1月末DeepSeek横空出世后,英伟达公布的首份财报。


那么,在DeepSeek的冲击下,黄仁勋是否能够交出一份令人满意的答卷?DeepSeek的崛起对于英伟达而言,又会有什么影响?


带着上述问题,我们请出了DeepSeek,看看这位“当事人”是怎么解读的。



不仅如此,DeepSeek还给了一份“赛博韭菜味”的轻松解读:


看来

不管是一本正经分析行业趋势

还是玩创意脑洞

DeepSeek统统拿捏!

但Please!!!

别再“服务器繁忙,请稍后再试”了

还好每日经济新闻APP火速前来“救场”

最近,每经APP接入了DeepSeek

响应速度快到飞起,使用起来非常丝滑!

不管是问公司、问投资、问基金,还是自由对话,都轻松拿捏!

目前使用量已经超14万次了!


咋用呢?超简单!

先下载每日经济新闻App

https://www.nbd.com.cn/corp/2016app/index.html

再往下看


一、在每日经济新闻App首页,点击“DeepSeek”图标或首页轮播图“自由问+问公司问投资问基金免费使用DeepSeek、Kimi、豆包等六款大模型”。


二、进入“每经大模型平台”页面,即可使用DeepSeek、Kimi、豆包、智谱清言、文心一言和通义千问6款大模型中任意一款。



最近,每经“136计划”还增加了新功能:

大模型解读投资热榜。


只需点击投资热榜中的任意新闻

立即就能得到大模型的全面分析

还能一键生成图片分享给朋友。

告别“服务器繁忙”

快用每日经济新闻App吧!


免责声明:本文内容与数据仅供参考,不构成投资建议,使用前请核实。据此操作,风险自担。

猜你想看


「重估成都,为什么说“少必入川”?」

「“国家队”重组,是武汉的机会吗?」

「杭州“破圈”,南京“自省”」


猜你想聊

图片


热点视频

更多城市热点视频,欢迎关注“城市进化论”


↓分享 点赞 在看

表达你的态度,也欢迎与我们讨论:)







请到「今天看啥」查看全文