弄完OpenAI的GPT-4.5,已经是7点多了。
但是感觉我真的有罪,我居然熬夜就为了看这个大垃圾。
虽然很想睡觉,但,今天可是DeepSeek开源的最后一天。
之前,连续4天,5个硬核项目,
FlashMLA、DeepGEMM、DeepE、DualPipe、EPLB,
两万多个Github星星,这都是全世界开源小伙伴们的倾情贡献。
3FS(Fire-Flyer
File System
)
链接在此:https://github.com/deepseek-ai/3FS
https://github.com/deepseek-ai/smallpond
简单来说,3FS就是一个专门AI模型和推理做的文件系统,只不过,它是分布式的,性能太强了。
昨天是面包厂,那我今天,在用奶茶工厂来给大家举个例子。
比如,你是一个奶茶世家,经营着一家超大规模的超级奶茶原材料工厂,开的贼大,专门给喜茶、霸王茶姬、CoCo、茶百道、蜜雪冰城等等全国各大奶茶品牌供应原材料。
每天有上万家门店等待着你的各种果汁、茶汤、蔗糖、珍珠、椰果啥的全都得从你这儿以极快的速度输送过去。
因为一旦原材料供不上,各家奶茶店就没法及时出茶,排队的顾客就得锤门店,门店就会来捶你。
而切大家的配方比例是要严格控制的,一旦某些配方仓库搞混数据,比如喜茶家的葡萄果肉和茶冻比例调错了,或
芭乐瓶里面的原料配比发错了
,又可能要被顾客捶。
所以你为了保持整套工厂是靠谱的、准确的,不会被各大家品牌方捶,你就需要一个无比宽敞、极度智能的流水线+库存网络。
而3FS(Fire-Flyer File System),就是你的这个究极分发系统。
每天都有成千上万的奶茶店要来仓库调取、回传各种信息,比如店家库存不足时要申请更多原材料,原材料运到门店后又需要登记消耗情况,遇到新品上线还要紧急调度不同产线来增产。
所有这些海量数据读写都得在极短时间内完成,否则延时太高就会造成门店断供或生产线浪费。
3FS不仅能把所有的分发全部处理掉,而且延时极低。
核心技术就在于,我们在厂区里安插了大量全新的高速自动化储物柜(这就是SSD),这些储物柜随时能被调度,门店的所有配方、原材料需求等信息都是数字化的,一按按钮就能知道哪里还剩下多少牛奶,哪里的茶叶正处在发货阶段。
而且,我们还造了一堆的光速传送带(RDMA),不需要过多的中转,一旦原料从储物柜那边这边发出,直接可以到达对应的节点,而不用像传统的先装车,然后普通货车开一大圈,再交给搬运工二次处理。
同时,我们这个工厂,把原材料加工区和原材料存储区分开,还把各种茶叶处理流水线和配料混合区都搞成了独立模块。
当某天喜茶或者蜜雪冰城研发了一个新品,门店突然给你下单了一个全新的配方,需要一种新的组合了,也没关系。
3FS让你不必关心这个原料是存在哪个仓库、由谁负责加工,因为在逻辑上,你可以看作整个工厂就是一个大同心圆,任何角落都能直接访问存储资源。这叫 locality-oblivious(不用再因为地理位置不同而做繁琐的调度),相当于你只要告诉工厂我要一批A茶叶和B奶盖,系统就能自动把所有加工、分发环节安排好。
对你来说几乎毫无感知,就像整个工厂是一个统一的池子。
现在再回去看DeepSeek给出的介绍,是不是就大概能看懂,知道这玩意是个啥了?
现在我们假设,你家的这个奶茶工厂,有180个高速自动化储物柜(存储节点),16个超大容量(14TB)的冷冻箱(NVMe SSDs),还有两个超快的光速传送带(200Gbps InfiniBand网卡)。
那在3FS的加持下,这个奶茶工厂,它1秒钟能送出6.6TiB的原材料。。。(1 TiB约等于1.1TB,有个有个换算关系,1TiB=1024GiB,1TB=1000GB)
约等于你可以一次性加载数千部高清乃至4K影片,一部 1080p 高清电影大小在2~3GB,4K电影大概10GB往上跑,以6.6TiB/s的吞吐来说,一秒钟就可以把几百到上千部电影打包塞进内存。
6.6 TiB/s已经属于往里塞东西时,硬盘都来不及转,网络都快成瓶颈的级别。
在现实的大规模分布式集群里能跑到这种速度,说明它已经把SSD和 RDMA网络的优势榨到极致,远超一般人日常认知的网速或存储吞吐。
然后还有一个
KVCache,
其实就是优化大模型推理过程的技术
。
KVCache 的读吞吐能飙到40GiB/s,也就意味着,当大量门店需要不断查询某些关键库存或实时交易数据时,3FS依然能挺住。
不至于像传统系统那样面对上万次请求就卡死。对比之下,其他系统要么没有足够的带宽,要么在同时进行移除垃圾或归档时会大幅拖慢读取速度。但在3FS这套工厂体系里,即使一边有人清理过期原材料(GC IOPS),另一边的订单读操作也能流畅进行,互不掣肘。
如果只看平均速度,那也稳的不能再稳了。这玩意儿最可怕的是,上下限都极高。
整个3FS就像DeepSeek开源的老作风,他们把所有使用教程统统给了出来,真是生怕我们不会用。。。
我还发现个好玩的,除了上面这个使用操作,还有个说明书大礼包。
就在这。设计笔记、安装指南、API参考、详细参数表都一应俱全。
我甚至以为DeepSeek,不想把日子过下去了。。。
再回过头,提一嘴开源的另一个东西,
Smallpond。
简单来说,这是一个特别轻量化的、但确实厉害的数据处理工具,基于DuckDB和3FS打造的。
比如,你可能想知道,哪些门店最喜欢什么口味?要从几十TB的销售记录里跑SQL查询统计,这在过去可能得搭Spark、Hadoop又或者别的大型分布式系统。
能处理PB级(也就是千万亿字节那种牛逼的级别)的数据。
它背后最大的功臣,还是3FS提供的高并发读写和存储共享能力,以及 DuckDB提供的高效SQL执行引擎。
所以,smallpond+3FS就是绝配,一个负责调度数据加工,一个负责高速数据通道,让PB级别的数据处理变得像做一杯奶茶那么轻松,真的。
Python 3.8到3.12版本就能用。DeepSeek一并把操作链接放下面了。
这几天,DeepSeek对老黄的GPU,下多少猛料了?
这下,为期五天的DeepSeek开源节正式华丽落幕了。
以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章,我们,下次再见。
>/ 作者:卡兹克、芝兰山
>/ 投稿或爆料,请联系邮箱:[email protected]