专栏名称: 观察者网
观察者网,智库与专业新闻媒体的完美结合。
目录
相关文章推荐
江南晚报  ·  取消!多地发布紧急提醒 ·  5 天前  
51好读  ›  专栏  ›  观察者网

英特尔也加入了:针对DeepSeek进行深度优化

观察者网  · 公众号  · 社会  · 2025-02-01 17:08

正文

美国科技巨头正积极拥抱DeepSeek。

2月1日,美国芯片巨头英特尔表示,近日中国AI公司DeepSeek发布Janus Pro模型,其超强性能和高精度引起业界关注,英特尔Gaudi 2D AI加速器现已针对该模型进行深度优化,这使得AI开发者能够以更低成本、更高效率实现复杂任务的部署与优化。

作为一款创新性的AIGC模型,DeepSeek Janus模型集成了多模态理解和生成功能。该模型首次采用统一的Transformer架构,突破了传统AIGC模型依赖多路径视觉编码的限制,实现了理解与生成任务的一体化支持。在此基础上,Janus Pro通过优化训练策略和扩展模型规模,显著提升了文生图等功能的性能与稳定性,并提供了10亿参数和70亿参数两个版本,在性能与精度上展现了较强的竞争力。

图源:github.com

在Janus Pro统一的Transformer架构下,文生图模型的吞吐量高低已经从依赖加速器的高算力,向充分利用HBM内存高带宽和大容量转换。

英特尔表示,Gaudi 2D凭借2.45TB/秒的高带宽和96GB HBM大容量内存,为Janus Pro模型提供了强大的计算支持,使其在生图批处理任务中,随着批量大小(Batch Size)的增加,吞吐性能得到显著提升,大幅缩短任务处理时间。

与此同时,结合英特尔Optimum-Habana框架的优化,英特尔Gaudi 2D显著提升了文生图任务的吞吐性能和推理效率,仅需约10秒即可生成16张高质量的图片。而且,开发者仅需调整数行代码,即可实现这一结果,极大降低了开发门槛和迁移成本。此外,DeepSeek的蒸馏模型在至强和Gaudi平台上也得到了支持。

这家美国芯片巨头还提到,DeepSeek-R1让轻量化模型本地部署更为简单,DeepSeek目前能够在英特尔产品上运行,更可以在AI PC上实现离线使用。

不止英特尔,一开始便对DeepSeek赞赏有加的英伟达,也在昨天(1月31日)宣布推理模型DeepSeek-R1正式登陆NVIDIA NIM微服务。据介绍,在单个NVIDIA HGX H200系统上,完整版DeepSeek-R1 671B的处理速度可达3872 Token/秒。

与此同时,亚马逊也在Amazon Bedrock和SageMaker AI中,上线了DeepSeek-R1模型。

曾经冲出来和OpenAI一起高调质疑DeepSeek“偷窃”数据的微软,甚至在前一天就把DeepSeek-R1抢先部署在了自家的云服务Azure上。

图源:微软社交媒体

英特尔的老对手AMD,也早在一周前就宣布,已将新的DeepSeek-V3模型集成到Instinct MI300X GPU上,该模型经过SGLang强化,针对Al推理进行了优化。

在人工智能专家吴恩达看来,本周围绕DeepSeek的热议,让许多人清晰地看到了几个一直存在的重要趋势:美国在生成式AI领域的领先地位正在被中国迎头赶上,AI供应链格局将被重塑;开放权重模型正在推动基础模型层商品化,为应用开发者带来新机遇;扩大规模并非通往AI进步的唯一途径,尽管算力备受追捧,但算法创新正在快速降低训练成本。

他在社交媒体上写道,当ChatGPT在2022年11月发布时,美国在生成式AI领域明显领先于中国。人们的印象转变是缓慢的,因此即使在最近,我仍然听到美国和中国的朋友都认为中国落后。但实际上,过去两年里,这种差距正在迅速缩小。凭借Qwen、Kimi、InternVL和DeepSeek等来自中国的模型,中国显然一直在缩小差距,并且在视频生成等领域,中国似乎已经处于领先地位。

“我很高兴DeepSeek-R1以开源权重模型发布,并附带技术报告,分享了许多细节。与此形成鲜明对比的是,一些美国公司为了扼杀开源,大肆炒作诸如人类灭绝等假设性的AI危险,推动监管。现在,开源/开源权重模型显然是AI供应链的关键组成部分:许多公司都将使用它们。如果美国继续阻碍开源,中国将主导AI供应链的这一环节,许多企业最终将使用更多反映中国价值观而非美国价值观的模型。”他表示。

来源|观察者网



推荐阅读








请到「今天看啥」查看全文