英特尔也加入了：针对DeepSeek进行深度优化

观察者网 · 公众号 · 社会 · 2025-02-01 17:08

正文

美国科技巨头正积极拥抱DeepSeek。

2月1日，美国芯片巨头英特尔表示，近日中国AI公司DeepSeek发布Janus Pro模型，其超强性能和高精度引起业界关注，英特尔Gaudi 2D AI加速器现已针对该模型进行深度优化，这使得AI开发者能够以更低成本、更高效率实现复杂任务的部署与优化。

作为一款创新性的AIGC模型，DeepSeek Janus模型集成了多模态理解和生成功能。该模型首次采用统一的Transformer架构，突破了传统AIGC模型依赖多路径视觉编码的限制，实现了理解与生成任务的一体化支持。在此基础上，Janus Pro通过优化训练策略和扩展模型规模，显著提升了文生图等功能的性能与稳定性，并提供了10亿参数和70亿参数两个版本，在性能与精度上展现了较强的竞争力。

图源：github.com

在Janus Pro统一的Transformer架构下，文生图模型的吞吐量高低已经从依赖加速器的高算力，向充分利用HBM内存高带宽和大容量转换。

英特尔表示，Gaudi 2D凭借2.45TB/秒的高带宽和96GB HBM大容量内存，为Janus Pro模型提供了强大的计算支持，使其在生图批处理任务中，随着批量大小（Batch Size）的增加，吞吐性能得到显著提升，大幅缩短任务处理时间。

与此同时，结合英特尔Optimum-Habana框架的优化，英特尔Gaudi 2D显著提升了文生图任务的吞吐性能和推理效率，仅需约10秒即可生成16张高质量的图片。而且，开发者仅需调整数行代码，即可实现这一结果，极大降低了开发门槛和迁移成本。此外，DeepSeek的蒸馏模型在至强和Gaudi平台上也得到了支持。

这家美国芯片巨头还提到，DeepSeek-R1让轻量化模型本地部署更为简单，DeepSeek目前能够在英特尔产品上运行，更可以在AI PC上实现离线使用。

不止英特尔，一开始便对DeepSeek赞赏有加的英伟达，也在昨天（1月31日）宣布推理模型DeepSeek-R1正式登陆NVIDIA NIM微服务。据介绍，在单个NVIDIA HGX H200系统上，完整版DeepSeek-R1 671B的处理速度可达3872 Token/秒。

与此同时，亚马逊也在Amazon Bedrock和SageMaker AI中，上线了DeepSeek-R1模型。

曾经冲出来和OpenAI一起高调质疑DeepSeek“偷窃”数据的微软，甚至在前一天就把DeepSeek-R1抢先部署在了自家的云服务Azure上。

图源：微软社交媒体

英特尔的老对手AMD，也早在一周前就宣布，已将新的DeepSeek-V3模型集成到Instinct MI300X GPU上，该模型经过SGLang强化，针对Al推理进行了优化。

在人工智能专家吴恩达看来，本周围绕DeepSeek的热议，让许多人清晰地看到了几个一直存在的重要趋势：美国在生成式AI领域的领先地位正在被中国迎头赶上，AI供应链格局将被重塑；开放权重模型正在推动基础模型层商品化，为应用开发者带来新机遇；扩大规模并非通往AI进步的唯一途径，尽管算力备受追捧，但算法创新正在快速降低训练成本。

他在社交媒体上写道，当ChatGPT在2022年11月发布时，美国在生成式AI领域明显领先于中国。人们的印象转变是缓慢的，因此即使在最近，我仍然听到美国和中国的朋友都认为中国落后。但实际上，过去两年里，这种差距正在迅速缩小。凭借Qwen、Kimi、InternVL和DeepSeek等来自中国的模型，中国显然一直在缩小差距，并且在视频生成等领域，中国似乎已经处于领先地位。

“我很高兴DeepSeek-R1以开源权重模型发布，并附带技术报告，分享了许多细节。与此形成鲜明对比的是，一些美国公司为了扼杀开源，大肆炒作诸如人类灭绝等假设性的AI危险，推动监管。现在，开源/开源权重模型显然是AI供应链的关键组成部分：许多公司都将使用它们。如果美国继续阻碍开源，中国将主导AI供应链的这一环节，许多企业最终将使用更多反映中国价值观而非美国价值观的模型。”他表示。

来源|观察者网

推荐阅读

英特尔也加入了：针对DeepSeek进行深度优化

正文

请到「今天看啥」查看全文