专栏名称: 新黄河
新黄河客户端是山东省市一体化打造的平台型新媒体旗舰,致力于打造全国有重要影响力,由济南日报报业集团主管主办,立足济南、服务山东、面向全国。
目录
相关文章推荐
小众消息  ·  关注你的人并不是都是会关心你的人 ·  6 小时前  
寿光公安交警  ·  春节我在岗|大年初二莫酒驾 交警“姑爷”不放假 ·  2 天前  
寿光公安交警  ·  春节我在岗|大年初二莫酒驾 交警“姑爷”不放假 ·  2 天前  
宝玉xp  ·  //@大红矛:-20250129033223 ·  3 天前  
叶子君的小门道  ·  给领导的拜年短信交给AI来写,差点没把我笑死 ·  4 天前  
叶子君的小门道  ·  给领导的拜年短信交给AI来写,差点没把我笑死 ·  4 天前  
51好读  ›  专栏  ›  新黄河

三家美国巨头同日接入DeepSeek,业内人士:DeepSeek或准备适配国产GPU

新黄河  · 公众号  · AI 科技自媒体  · 2025-02-01 14:00

主要观点总结

文章主要围绕“DeepSeek”技术展开,介绍了其引起的全球关注、技术特点、与CUDA的关系、内部开发者的技能、以及其在工程上的技巧和未来前景。

关键观点总结

关键观点1: DeepSeek引起全球关注

各路业内人士仍在从不同角度深入分析DeepSeek的模型和技术,英伟达宣布DeepSeek-R1模型登陆NVIDIANIM,亚马逊和微软也接入此模型,且DeepSeek被誉为最先进的大语言模型。

关键观点2: DeepSeek技术特点

DeepSeek在研发时绕过了CUDA,使用英伟达的PTX语言。这可以让开发者更精细地控制GPU,但需要专业度较高的开发者。使用PTX写出来的代码非常复杂,且很难维护。

关键观点3: DeepSeek的工程技巧

DeepSeek的技术报告表明其在工程上非常有技巧,其主体实现还是基于CUDA的相关接口。如果有内部开发者擅长写PTX语言,那么未来使用国产GPU时,其在硬件适配方面将会更得心应手。

关键观点4: DeepSeek的未来前景

由于DeepSeek的技术实力和工程技巧,未来不排除有更多GPU厂商与其合作。同时,美国对华制裁可能激发其紧迫感和创造力。


正文

尽管春节假期已经过半,但是“来自东方的神秘力量的 DeepSeek”仍在引起全世界热议,各路业内人士也仍在从不同角度分析 DeepSeek 的模型和技术文章。
北京时间1月31日,英伟达宣布DeepSeek-R1模型登陆NVIDIANIM。同一时段内,亚马逊和微软也接入DeepSeek-R1模型。英伟达称,DeepSeek-R1是最先进的大语言模型。

韩国 Mirae Asset Securities Research 的一名分析师在 X 撰写长文分析称:“这一突破是通过实施大量细粒度优化和使用英伟达的汇编式 PTX 编程,而非通过英伟达 CUDA 中的某些功能来实现的。”

(来源:X)

也就是说 DeepSeek 在研发大模型时绕过了 CUDA。CUDA(Compute Unified Device Architecture,统一计算架构),是由英伟达开发的一种通用编程框架,它允许开发者利用英伟达的图形处理器(GPU,Graphics Processing Unit)进行通用计算。

如果 DeepSeek 真的绕过了 CUDA,那么这能说明什么?

在 DeepSeek-V3 的技术博文中,DeepSeek 表示其使用了英伟达的 PTX(Parallel Thread Execution)语言。

假如 DeepSeek 的开发者能够很好地使用 PTX(Parallel Thread Execution)语言,那么相比使用 CUDA 提供的编程接口,肯定可以更精细地控制 GPU 之间传输数据、权重和梯度等。但是,使用 PTX 写出来的代码非常复杂,且很难维护,因此需要专业度较高的开发者。

(来源:DeepSeek)

也就是说,绕过 CUDA 的做法具有一定的技术难度,这需要开发者既要懂 AI 模型的算法,又要懂计算机系统架构来高效分配硬件资源。如果没有同时掌握这两方面技能的开发者,那就要分别招聘懂这些技能的开发者,即需要协调好不同人员。

从 DeepSeek 的技术报告来看,其主体实现还是基于 CUDA 的相关接口,其描述中也阐述绕开了 CUDA 来写通信,那就意味着它招聘了掌握不同技能的人才,并能将这些人才很好地串了起来。

这也说明 DeepSeek 拥有一些擅长写 PTX 语言的内部开发者。那么,假如它之后使用国产 GPU,其在硬件适配方面将会更得心应手,其只要了解这些硬件驱动提供的一些基本函数接口,就可以仿照英伟达 GPU 硬件的编程接口去写相关的代码,从而让自家大模型更加容易适配国产硬件。

与此同时,从 DeepSeek 的技术报告来看,其技术从学术研究角度并没有胜出一筹,但是在工程上面的确非常有技巧。考虑到 AMD 已经宣布集成DeepSeek-V3到 MI300X GPU,因此未来不排除会有更多 GPU 厂商牵手 DeepSeek。

同时,也正如上述韩国分析师在同一篇 X 文章中所说的:“这凸显了DeepSeek非凡的工程水平,并表明美国对华制裁加剧的“GPU 短缺危机“激发了他们紧迫感和创造力。“

你有什么想说的
 欢迎留言区分享 

最近微信再次改版
星标“新黄河”
及时接收每篇推送文章

↓↓
推荐阅读
👉突发!一架飞机在美国费城坠毁,已致6人死亡
👉多地倡议春节少发压岁钱:建议不超过20元
来源:大象新闻、深科技
编辑:赵珊珊  校对:汤琪
提醒更多人看到,点赞点在看