专栏名称: 黄建同学
数码博主 超话主持人(ChatGPT超话) 头条文章作者 我的学习笔记,关注AI+新能源
目录
相关文章推荐
财联社AI daily  ·  阿里扔“王炸”! ·  13 小时前  
财联社AI daily  ·  阿里扔“王炸”! ·  13 小时前  
伯益说环保  ·  我们随时可能被淘汰,环评已进入AI时代 ·  20 小时前  
伯益说环保  ·  我们随时可能被淘汰,环评已进入AI时代 ·  20 小时前  
申妈的妹子圈  ·  曹大鹏出任即梦AI移动端负责人 向张楠汇报 ·  昨天  
申妈的妹子圈  ·  曹大鹏出任即梦AI移动端负责人 向张楠汇报 ·  昨天  
爱可可-爱生活  ·  【[1.7k星]best-system-de ... ·  2 天前  
51好读  ›  专栏  ›  黄建同学

//@karminski-牙医:解释下这个库能干嘛:大家都知道D-20250226124430

黄建同学  · 微博  · AI  · 2025-02-26 12:44

正文

2025-02-26 12:44

// @karminski-牙医 :解释下这个库能干嘛:大家都知道DeepSeek一项重大进步是使用FP8精度进行训练。训练的本质其实是矩阵乘法。默认大家都使用NVIDIA CUDA库中提供的矩阵乘法. 这个库在最优情况可以将矩阵乘法性能提升2.7x. 可以加速训练速度. 另外在早些年一些商用BLAS库(包含矩阵乘法,通常性能比开源BLAS库好)卖得很贵..
DeepSeek 开源周的3号炸弹来啦!DeepGEMM!

这是个FP8 通用矩阵乘法库,该库用 CUDA 编写,安装时无需编译,并且内置了JIT(真的牛逼)!官方数据最大性能获得了2.7倍的提升。






请到「今天看啥」查看全文