专栏名称: 科普中国
公众科普,科学传播
目录
相关文章推荐
科普中国  ·  爸妈,千万别心疼钱,这4种零食就该吃就吃 ·  2 天前  
科普中国  ·  什么是反向传播算法? ·  4 天前  
51好读  ›  专栏  ›  科普中国

什么是长短期记忆?

科普中国  · 公众号  · 科学  · 2025-02-01 10:30

正文


欢迎来到科普中国特别推出的寒假精品栏目“给孩子的高新科技课”!


人工智能作为当今最前沿的科技之一,正在以令人惊叹的速度改变着我们的生活。从智能语音助手到无人驾驶汽车,从 AI 绘画到机器学习,它为我们打开了一个充满无限可能的未来。本栏目将以通俗易懂的方式,用视频和文字给孩子讲述人工智能的原理、应用及其对社会的深远影响。


快跟我们一起开启这场 AI 之旅吧!









先来看视频:


以下为文字版本:

(阅读大约需要 1 分钟)


长短期记忆


LSTM的全称是长短期记忆网络,是一种基于循环神经网络的架构。它能够很好地解决循环神经网络中的梯度消失问题。


梯度消失指的是:循环神经网络在处理信息的时候,如果碰到的内容太长,在处理到后面内容的时候,可能已经忘了前面提到的信息了,这会影响神经网络的训练效果。


LSTM架构在神经网络中增加了一个称作“细胞状态”的模块,这个模块像是一个记忆库。在训练过程当中,这个模块能不断地对记忆库里的信息进行更新,增加新的记忆,删除不必要的旧的记忆。在处理长信息的时候,细胞状态能够防止遗忘,实现更好的训练效果。


除了处理文本信息LSTM在语音识别手写识别动作识别机器人控制等方面也有非常广泛的应用


策划制作

本文为科普中国-创作培育计划作品

出品|中国科协科普部

监制|中国科学技术出版社有限公司、北京中科星河文化传媒有限公司

作者丨北京云御纪文化传播有限公司

审核丨秦曾昌 北京航空航天大学 自动化科学与电气工程学院 副教授

策划丨符思佳

责编丨符思佳


本文封面图片及文内图片来自版权图库

转载使用可能引发版权纠纷
原创图文转载请后台回复“转载”


点亮“在看”

一起涨知识!