专栏名称: 信号与噪声
财经观察官 互联网科技博主 应该是美股等海外投资信息最多的号了吧~当笔记本用的,看到有用的海外投资信息都往这里放~另,《信号与噪声》是一本很值得看的书啊~
目录
相关文章推荐
三峡小微  ·  大国重器前的宣讲:单单的三峡情 ·  2 天前  
三峡小微  ·  “线性菲涅尔”光热储能电站的追光者 ·  4 天前  
51好读  ›  专栏  ›  信号与噪声

这个分析有点意思~~~~~~🔥为什么苹果受益于DeepSeek-20250128211111

信号与噪声  · 微博  ·  · 2025-01-28 21:11

正文

2025-01-28 21:11

这个分析有点意思
~~~~~~
🔥为什么苹果受益于DeepSeek最大?

美股 昨晚:
英伟达 -16.91%
苹果 +3.21%

以下是当前市场上能运行DeepSeek V3和R1的芯片对比:

• 英伟达H100:80GB @ 3TB/s,25,000美元,每GB成本312.50美元
• AMD MI300X:192GB @ 5.3TB/s,20,000美元,每GB成本104.17美元
• 苹果M2 Ultra:192GB @ 800GB/s,5,000美元,每GB成本26.04美元(惊人!)

苹果M2 Ultra(2023年6月发布)的单位内存成本效益是AMD MI300X的4倍,是英伟达H100的12倍!

🔥这与 #DeepSeek# 有何关联?

DeepSeek V3/R1是拥有6710亿总参数的混合专家模型,但每次生成token时仅激活370亿参数。由于无法预知具体哪些参数会被激活,所有参数必须常驻高速显存。

普通系统内存速度过慢(会导致<1 token/秒的生成速度),而传统GPU显存成本过高。苹果芯片通过统一内存架构和UltraFusion技术,开创性地实现了大容量中高速内存的经济性方案。

关键技术解析:
1. 统一内存架构:CPU和GPU共享内存池,消除数据拷贝开销
2. UltraFusion互联:通过2.5TB/s超高速互联技术,将两颗M2 Max芯片融合为M2 Ultra,实现192GB统一内存和800GB/s带宽

未来展望:
传闻中的M4 Ultra将沿用该技术,通过连接两颗M4 Max芯片实现256GB统一内存(!)和1146GB/s带宽。仅需两颗该芯片即可实现DeepSeek V3/R1(4-bit量化版)57 token/秒的推理速度。

更值得关注的是:
- 紧凑消费级设备形态
- 卓越能效表现
- 突破性开源生态
- 已有7台M4 Mac Mini集群运行DeepSeek R1(6710亿参数)的成功案例

虽然最终AI模型之争尚未定论,但可以预见的是:

未来的AI计算战场,苹果芯片正展现出独特的硬件优势。






请到「今天看啥」查看全文