文章提到了发布内容的时机,强调感谢华为和oneflow的包容和照顾,并突出了国产AI基础创新的重要性。
文章指出了AI产业链的发展状况,包括已经取得的进展和仍存在的挑战。
一早放在星球,算是全网最先,抢在华为和oneflow 发布之前提前说了…也感谢两边大佬们照顾和包容。但国产的突破的确令人兴奋,何况华为和 DS,这可能是国产 AI 基础创新最重要的两家公司。
NV 已经测了GB200 跑 r1,跑出了3800 token /秒的throughput纪录,H100大概100 左右。910B过两周会更新些通信算子,最终会与 H100 相当。以及大家问最多的 910C跑 r1 ,华为云内部 910C 部署已经开始,因此是个时间问题,大概率超H100
引述下 Y 博:以前910有用没用, 通义豆包这些兄弟说了算;现在910有用没用,昇腾自己说了算。
就是我们之前讲过的,这就是开源的意义,生态一起努力 。AMD,华为,甚至寒武纪?总之适配的工作量大幅降低。当然,推理最终是个服务,比拼复杂场景并发serving 的效率,是个软硬件协同优化的结果。国内选择并不多,能匹配H100 够用了。
HW大佬的评价:DeepSeek基于H800一小时2美元的成本来定价,肯定是赚钱的,只要国产硬件能低于这个价格来提供服务,这个商业肯定能闭环。
至此,AI 产业链全国产进一步接近闭环,但依然还有一些瓶颈工程,比如:
1)训练,基于全国产卡的训练;
2)产能,希望南方厂的扩张瓶颈逐渐解决。
两个工程难度极大,但也是真正实现 AI 追赶的基础工程。
智能最终应该成为水电煤,你很难想象水电煤继续进口。从国家安全角度我们应该也一定尽力实现AI基础设施的自主可控。Deepseek r1实现了一个意想不到的突破,“自主、优秀、普惠的推理模型,能开启民智,奠定基础竞争力”。剩下的光刻机等核心设备、先进逻辑和内存工艺、基于国产卡的集群训练,相信这些在未来几年会陆续带来惊喜。