视频解读 | 面向神经网络语言模型的神经网络结构自学习方法研究

AI科技评论 · 公众号 · AI · 2020-02-18 12:30

正文

作者 | 姜雨帆

责编 | Camel

神经网络的结构学习是目前十分受关注的一个研究方向，主要包含网络结构优化和网络结构搜索两个方向。

本次报告从两方面对神经网络的结构学习进行研究，首先从网络结构优化的角度，提出了一种动态网络连接的自动学习方法。

动态的去学习网络的连接，这种连接生长和剪枝的方式完全和训练相关，参考了训练过程中的梯度，层和层之间信息流传递的有效性，可以更好的对网络连接进行动态操作，从而得到更紧凑、高效的模型结构。

除此之外，我们还对可微分的网络结构搜索方法进行改进，移除了原有的局部归一化限制，同时对网络结构进行采样的更新方法，使得可微的网络结构搜索过程更稳定、高效。

最后，我们也通过定量和定性的实验分析了提出的两种方法的有效性。

（或者到AI研习社官网观解读视频：http://www.mooc.ai/open?from=meeting）

作者简介：

姜雨帆，东北大学计算机系自然语言处理实验室研究生，师从肖桐副教授。研究方向为自然语言处理，已在EMNLP人工智能和自然语言处理顶级会议发表论文一篇。

更多论文视频解读：

01. [UCSB 王威廉组] 零样本学习，来扩充知识图谱（视频解读）

推荐文章

爱可可-爱生活 · 本文提出了 LADDER 和 TTRL 框架，通过递归问题分解和-20250309053105

昨天

宝玉xp · GPT-4.5 的多模态还是挺强的 Gemini 很厉害，Fla-20250307235124

2 天前

爱可可-爱生活 · 从分布中提取判断：让AI评价更准确查看图片 //@爱可可-爱-20250307131712

3 天前

机器之心 · FP8训练新范式：减少40%显存占用，训练速度提高1.4倍

3 天前

爱可可-爱生活 · 本文提出了一种基于过程的自奖励学习框架，通过逐步推理、逐步LLM-20250307053543

3 天前

掌上太原 · 小心中招！太原街头又出现的“绿色自行车”，你骑得时候要注意！

8 年前

肌肉男训练营 · 小白勿进！进阶徒手全身爆发力训练，虐遍全身！

7 年前

中金所发布 · 中国期货业协会2017年社会招聘公告

7 年前

财新网 · 统计局：中国常住人口城镇化率达57.4%

7 年前

菱歌智能营销 · Facebook入局智能音箱市场，“耳边风”将成为新的流量入口

7 年前