专栏名称: 架构师之路
架构师之路,坚持撰写接地气的架构文章
目录
相关文章推荐
51好读  ›  专栏  ›  架构师之路

DeepSeek为什么这么牛?幻方三大核心技术解密!

架构师之路  · 公众号  · 架构  · 2025-03-25 11:55

正文

请到「今天看啥」查看全文


《‍deepseek原理应用与实践》

16.幻方三大核心技术创新

幻方三大核心技术探秘(软件架构)。


梁文峰说, 我们缺的从来都不是钱,而是高端芯片

幻方官网显示, 2022 年, 公司员工 一只平凡的小猪 一个人就向捐助了 1.38 亿。 你说,这是钱的事吗?


为了突破卡脖子,幻方选择了搞 AI 的另一条路: 从软件架构突破。 理解了这个战略方向,就不难理解幻方核心技术突破点了。


要搞 AI ,存储,通信,计算三者缺一不可。

幻方的软件架构优化三大核心技术,正好与其一一对应。


存储模块 ,核心技术: 3FS

通信模块 ,核心技术: hfreduce

计算模块 ,核心技术: hfai.nn


杀手锏一: 3FS


3FS 是什么?

一个用 C++ 写的 高性能分布式文件系统


幻方为什么要搞 3FS

AI 训练与推理的业务需求,传统分布式文件系统已经难以满足:

1. 海量数据顺序读(语料输入);

2. 检查点(分步骤重算);

3. 顺序写(模型参数保存);

4. 随机读(特征查询);


任何脱离业务的架构设计都是耍流氓。 既然已有的分布式文件系统无法满足需求时,幻方就说,那我自己重写一个。


重写后的 3FS 有多牛逼?

读: 8T/s

写: 500G/s

IO 响应: 18 亿次 /s

集群使用率: 96%

GPU 使用率: 85%


这个项目已开源,感兴趣的同学可在 git 查看细节。


杀手锏二: hfreduce


hfreduce 是什么?

一个 高性能多卡并行通信工具


本质上 hfreduce 相当于 PyTorch 中的 DistributedDataParallel DDP ,只不过使用 CPU 做加法运算以计算总梯度,而不是调用其他的集体通信库( CCL ),传递梯度到不同的显卡上,再各自计算总梯度。


幻方为什么要搞 hfreduce

还是那句话,任何脱离业务的架构设计都是耍流氓。幻方 AI 之所以采用 CPU 来做加法运算,计算总梯度,是因为 幻方的主要 AI 场景是金融行为分析、自然语言处理、生物分子结构预测等。


在这些场景中,基本是 数据规模大而模型大小适中 。换句话说,在 A100 显卡 40G 的显存中,完全可以装得下一个完整的模型和批次样本数据。因此,模型的加速主要是依赖大量的数据并行, 让尽可能多的显卡参与训练,再同步梯度。


hfreduce 达到什么效果?

如上图所示,对比传统通信方案,训练速度提高了多少,不用我多说了吧。


杀手锏三: hfai.nn


hfai.nn 是什么?

幻方 AI 深度学习算子。


幻方为什么要搞 hfai.nn

深度学习框架的流行(如 PyTorch Tensorflow 等)极大方便了我们研发设计各种各样的 AI 模型,而在实际落地的环节中,模型代码往往面临着性能、准确度、资源等各种各样的问题。


幻方自研了一系列 AI 基础设施: 3FS hfreduce 之后,同样需要对 Pytorch 框架进行了深度优化, 结合自身集群特点与自身业务特点,对一些常用的 AI 算子重新研发,提升效率 ,于是,就有了 hfai.nn


幻方按照 PyTorch 框架风格,在 hfreduce 的基础上进行进一步封装,使用方法和 PyTorch DDP 基本相同,但性能与表现明显比后者更好。


hfai.nn 达到什么效果?


最重要的三个算子:

LSTM (长短期记忆网络)

画外音:记住重要的,忘记无关的,核心是根据重要性打分。

训练性能提升 8 倍。


Attention (注意力机制)

画外音:动态关注当下最相关的,核心是 QKV

训练性能提升 40%+ ,推理性能提升 30%+


LayerNorm (归一化)

画外音:把数据拉到均值 0 ,方差 1 的标准范围。

训练性能提升 88%


总结

幻方软件架构三大核心技术,对于幻方的发展,对于 deepseek 的发展,至关重要。在幻方的官网,在最显眼的地方,是这么描述的:


思路,比结论更为重要。


信息来源,幻方官网博客:

2019 年: www.high-flyer.cn/blog/3fs/

2020 年: www.high-flyer.cn/blog/hf-reduce/

2021 年: www.high-flyer.cn/blog/hfnn/


== 全文完 ==


近期好文:

DeepSeek开源周,7大项目详细解密


我:花 100 倍的时间看官方文档

你:花 3 分钟吸收


了解 AI ,学习架构,关注架构师之路。

宝藏号, 日更

一键三连 ,让平台知道什么值得被推荐。







请到「今天看啥」查看全文