专栏名称: 机器学习研究会

机器学习研究会是北京大学大数据与机器学习创新中心旗下的学生组织，旨在构建一个机器学习从事者交流的平台。除了及时分享领域资讯外，协会还会举办各种业界巨头/学术神牛讲座、学术大牛沙龙分享会、real data 创新竞赛等活动。

【论文】A Structured Self-attentive Sentence Embedding

机器学习研究会 · 公众号 · AI · 2017-03-28 20:27

正文

点击上方“机器学习研究会”可以订阅哦

摘要

转自：智能立方

1 导读

2 模型

模型如图1所示为模型的结构框图，公式下所示Wi为句子S中的词语。在本模型中采用了双向LSTM如公式(2)(3)所示，将正向反向的隐状态拼接起来得到公式(4)

如公式(6)所示，为模型的self-attention部分，其中Ws1维度为da-by-2u，Ws2维度为r-by-da，经过softmax得到维度为r-by-n的attention矩阵，最后如公式(7)对各个隐状态进行加权。

为了保证得到的attention矩阵的每一行代表不同的方面，作者加入采用Frobenius范数惩罚项，如公式(8)，来替代不起作用的KL散度。

原文链接：

http://mp.weixin.qq.com/s/twdpsEXll3t521o2qD2DWg

“完整内容”请点击【阅读原文】

↓↓↓

推荐文章

爱可可-爱生活 · 【世界模型操纵相关资源精选：汇集了关于操纵世界模型的有用论文和资-20240921172752

昨天

硅星GenAI · AI周榜 | 通义开源Qwen2.5模型；Vast正式上线Tripo 2.0

2 天前

硅星GenAI · AI周榜 | 通义开源Qwen2.5模型；Vast正式上线Tripo 2.0

2 天前

爱可可-爱生活 · 【ShellAgent：功能强大、开放且模块化的Agentic框-20240917212739

5 天前

Founder Park · 3 个月，和创新工场一起，做一款能挣钱的 AI 应用！

1 周前

Founder Park · 3 个月，和创新工场一起，做一款能挣钱的 AI 应用！

1 周前

爱可可-爱生活 · 【VSAG：用于相似性搜索的向量索引库，支持大尺寸向量集的搜索，-20240915170727

1 周前

心理语录 · 慢慢的，我们都变了...

7 年前

互联网新鲜事 · 关于腾讯公司加班，这张图突然火了。。。

7 年前

摄影笔记 · 一分钟变身摄影专家

7 年前

HitHitMe · HitssMeetup报名 | 有没有勇气来聊一下勇气

7 年前

观点 · 豹爷的新搭档雅居乐借桥路劲首入济南与陈卓林艰难北上

6 年前