还有琼瑶的小说。那时候看一本小说太难了。
#DeepSeek发布技术论文#
,
#DeepSeek最新技术论文梁文锋是共创之一#
2月18日,DeepSeek官方在海外社交平台X上发布了一篇纯技术论文报告,论文主要内容是关于原生稀疏注意力,官方介绍这是一种用于超快速长文本训练与推理的、硬件对齐且可原生训练的稀疏注意力机制。
用大白话翻译一下:
就好比你看一篇很长的文章,不用一个字一个字去看,而是只挑那些关键的、重要的字或句子看,抓住重点来理解文章意思。在计算机处理数据时也是这样,不关注所有数据,只聚焦部分关键数据来提高处理效率和效果。
➡️只挑重要的看,这个我可太会了,这是以前读初中偷看金庸古龙武侠小说练岀来的。借人家的书短时间必须看完还回去,这可能是我们 @财宝宝 这些70后的回忆。
2月18日,DeepSeek官方在海外社交平台X上发布了一篇纯技术论文报告,论文主要内容是关于原生稀疏注意力,官方介绍这是一种用于超快速长文本训练与推理的、硬件对齐且可原生训练的稀疏注意力机制。
用大白话翻译一下:
就好比你看一篇很长的文章,不用一个字一个字去看,而是只挑那些关键的、重要的字或句子看,抓住重点来理解文章意思。在计算机处理数据时也是这样,不关注所有数据,只聚焦部分关键数据来提高处理效率和效果。
➡️只挑重要的看,这个我可太会了,这是以前读初中偷看金庸古龙武侠小说练岀来的。借人家的书短时间必须看完还回去,这可能是我们 @财宝宝 这些70后的回忆。