专栏名称: 架构师之路

架构师之路，坚持撰写接地气的架构文章

DeepSeek为什么这么牛？幻方三大核心技术解密！

架构师之路 · 公众号 · 架构 · 2025-03-25 11:55

正文

请到「今天看啥」查看全文

《‍deepseek原理应用与实践》

16.幻方三大核心技术创新

幻方三大核心技术探秘（软件架构）。

梁文峰说，我们缺的从来都不是钱，而是高端芯片。

幻方官网显示， 2022 年，公司员工 “ 一只平凡的小猪 ” 一个人就向捐助了 1.38 亿。你说，这是钱的事吗？

为了突破卡脖子，幻方选择了搞 AI 的另一条路：从软件架构突破。理解了这个战略方向，就不难理解幻方核心技术突破点了。

要搞 AI ，存储，通信，计算三者缺一不可。

幻方的软件架构优化三大核心技术，正好与其一一对应。

存储模块，核心技术： 3FS

通信模块，核心技术： hfreduce

计算模块，核心技术： hfai.nn

杀手锏一： 3FS

3FS 是什么？

一个用 C++ 写的高性能分布式文件系统。

幻方为什么要搞 3FS ？

AI 训练与推理的业务需求，传统分布式文件系统已经难以满足：

1. 海量数据顺序读（语料输入）；

2. 检查点（分步骤重算）；

3. 顺序写（模型参数保存）；

4. 随机读（特征查询）；

任何脱离业务的架构设计都是耍流氓。既然已有的分布式文件系统无法满足需求时，幻方就说，那我自己重写一个。

重写后的 3FS 有多牛逼？

读： 8T/s

写： 500G/s

IO 响应： 18 亿次 /s

集群使用率： 96%

GPU 使用率： 85%

这个项目已开源，感兴趣的同学可在 git 查看细节。

杀手锏二： hfreduce

hfreduce 是什么？

一个高性能多卡并行通信工具。

本质上 hfreduce 相当于 PyTorch 中的 DistributedDataParallel （ DDP ），只不过使用 CPU 做加法运算以计算总梯度，而不是调用其他的集体通信库（ CCL ），传递梯度到不同的显卡上，再各自计算总梯度。

幻方为什么要搞 hfreduce ？

还是那句话，任何脱离业务的架构设计都是耍流氓。幻方 AI 之所以采用 CPU 来做加法运算，计算总梯度，是因为幻方的主要 AI 场景是金融行为分析、自然语言处理、生物分子结构预测等。

在这些场景中，基本是数据规模大而模型大小适中。换句话说，在 A100 显卡 40G 的显存中，完全可以装得下一个完整的模型和批次样本数据。因此，模型的加速主要是依赖大量的数据并行，让尽可能多的显卡参与训练，再同步梯度。

hfreduce 达到什么效果？

如上图所示，对比传统通信方案，训练速度提高了多少，不用我多说了吧。

杀手锏三： hfai.nn

hfai.nn 是什么？

幻方 AI 深度学习算子。

幻方为什么要搞 hfai.nn ？

深度学习框架的流行（如 PyTorch ， Tensorflow 等）极大方便了我们研发设计各种各样的 AI 模型，而在实际落地的环节中，模型代码往往面临着性能、准确度、资源等各种各样的问题。

幻方自研了一系列 AI 基础设施： 3FS ， hfreduce 之后，同样需要对 Pytorch 框架进行了深度优化，结合自身集群特点与自身业务特点，对一些常用的 AI 算子重新研发，提升效率，于是，就有了 hfai.nn 。

幻方按照 PyTorch 框架风格，在 hfreduce 的基础上进行进一步封装，使用方法和 PyTorch 的 DDP 基本相同，但性能与表现明显比后者更好。

hfai.nn 达到什么效果？

最重要的三个算子：

LSTM （长短期记忆网络）

画外音：记住重要的，忘记无关的，核心是根据重要性打分。

训练性能提升 8 倍。

Attention （注意力机制）

画外音：动态关注当下最相关的，核心是 QKV 。

训练性能提升 40%+ ，推理性能提升 30%+ 。

LayerNorm （归一化）

画外音：把数据拉到均值 0 ，方差 1 的标准范围。

训练性能提升 88% 。

总结

幻方软件架构三大核心技术，对于幻方的发展，对于 deepseek 的发展，至关重要。在幻方的官网，在最显眼的地方，是这么描述的：

思路，比结论更为重要。

信息来源，幻方官网博客：

2019 年： www.high-flyer.cn/blog/3fs/

2020 年： www.high-flyer.cn/blog/hf-reduce/

2021 年： www.high-flyer.cn/blog/hfnn/

== 全文完 ==

近期好文：

《 DeepSeek开源周，7大项目详细解密》

我：花 100 倍的时间看官方文档

你：花 3 分钟吸收

了解 AI ，学习架构，关注架构师之路。

宝藏号，日更。

一键三连 ，让平台知道什么值得被推荐。