专栏名称: 机器之心
目录
相关文章推荐
爱可可-爱生活  ·  【Mercury ... ·  15 小时前  
量子位  ·  英伟达创纪录财报回应DeepSeek:全年营 ... ·  19 小时前  
爱可可-爱生活  ·  《爱可可微博热门分享(2.26)》 ... ·  昨天  
机器之心  ·  从零开始自主「起身站立」,上海AI ... ·  2 天前  
51好读  ›  专栏  ›  机器之心

RNN失宠、强化学习风头正劲,ICLR 2019的八点参会总结

机器之心  · 掘金  · AI  · 2019-05-15 02:57

正文

阅读 31

RNN失宠、强化学习风头正劲,ICLR 2019的八点参会总结

上周,深度学习顶会 ICLR 2019 在新奥尔良落幕。毕业于斯坦福大学、现就职于英伟达的计算机科学家Chip Huyen参加了这次会议,并总结出了参会的8点感受。

选自huyenchip,作者:Chip Huyen,机器之心编译。

1. 包容性

ICLR 2019 组织者强调包容性在AI中的重要性,前两个主要演讲——Sasha Rush的开场致辞和Cynthia Dwork的受邀演讲——都是有关公平和平等的。以下是一些令人担忧的统计数据:

  • 只有8.6%的展示者(oral和poster)和15%的参会者是女性;

  • 2/3的LGBTQ+研究者没有以专业身份出席;

  • 8名受邀演讲者均为白人。

Sasha Rush开场致辞的一页PPT。

不幸的是,这种情况似乎并没有引起AI研究者的注意和反思。其他的workshop都爆满,但AI for Social Good workshop却门可罗雀,直到Yoshua Bengio出现。在我参与的众多ICLR交流活动中,没有人提到过多样性,直到有一次我大声问出来为什么我被邀请到这个并不适合我的科技活动,一位朋友告诉我说,“说出来可能有点冒犯,请你来是因为你是女性。”

这种现象出现的一个原因是,这类话题并非“技术性”的,因此在上面花时间并不会对你的研究生涯有所助益。另一个原因是,社会宣传仍然存在一些问题。一位朋友曾告诉我,不要理睬那个在群聊中挑衅我的家伙,因为“他喜欢取笑那些探讨平等和多样性的人”。我有些朋友不会在网上谈论任何有关多样性的话题,因为他们不想“和那种话题扯上关系”。

2. 无监督表征学习 & 迁移学习

无监督 表征学习 的主要目标是从无标注数据中发现有用的数据表征,以完成后续任务。在NLP中,无监督表征学习通常是利用语言建模完成的。然后将学到的表征用到情感分析、命名实体识别、 机器翻译 等任务中。

去年有一些比较令人振奋的论文是关于NLP无监督表征学习的,包括 ELMo (Peters et al.)、ULMFiT (Howard et al.)、 OpenAI ’s GPT (Radford et al.)、 BERT (Devlin et al.),当然,还有「危险性太大而不能公布的 GPT-2 」。

完整的 GPT-2 模型在ICLR上进行了展示,效果惊人。你可以输入任意提示,由它来完成后续文本创作。

GPT-2应用网站:https://talktotransformer.com/

Adam King利用GPT-2做成的应用网站。输入为“what does Amazon want to do”(ps:实际转化速度较慢,动画为删减绝大部分重复帧之后的效果)。网站地址:https://talktotransformer.com/

GPT-2可以写出各种文章、科学论文甚至是编造词汇的定义。但是GPT-2现在看起来还没有完全达到人类水平。该团队正在致力于GPT-3的研究,这个模型更大,也可能更好。

虽然 计算机视觉 是首个成功应用迁移学习的社区,但其基本任务——在ImageNet上训练分类模型——仍然是监督式的。自然语言处理社区和计算机视觉社区都在问同一个问题:「怎样才能将无监督表征学习应用到图像上?」

尽管那些最有名的实验室已经开始研究,但只有一篇论文出现在ICLR大会上:「Meta-Learning Update Rules for Unsupervised Representation Learning」(Metz et al.)。该研究团队没有更新权重,而是用算法更新学习规则。接下来在少量标注样本上微调从学得学习规则中学到的表征,来解决图像分类问题。他们能够在MNIST和Fashion MNIST上找到准确率大于70%的学习规则。作者不打算公布代码,因为“它与计算有关”。外层循环需要大约10万训练步,在256个GPU上需要200个小时的训练时间。

元学习的内、外循环(Metz et al.)。

我有一种感觉,在不久的将来,我们会看到更多这样的论文。可以使用无监督学习的任务包括:自动编码、预测图像旋转(Gidaris等人的论文《Unsupervised Representation Learning by Predicting Image Rotations》在ICLR 2018上很火)、预测视频中的下一帧。

3. ML的复古

机器学习领域的想法和时尚类似,都是循环式的。在poster session四处走走感觉像走在记忆的回廊上。即使最受期待的ICLR辩论也终结在「先验 vs 结构」的话题上,而这是去年Yann LeCun 和 Christopher Manning讨论过的话题,这种讨论类似贝叶斯学派和频率学派之间的经年辩论。

MIT媒体实验室的「Grounded Language Learning and Understanding」项目在2001年就中断了,但是grounded language learning今年带着两篇论文重回舞台,不过它穿上了强化学习的外衣:

  • DOM-Q-NET: Grounded RL on Structured Language (Jia et al.):给出一个用自然语言表达的目标,该 强化学习 算法通过填充字段和点击链接学习导航网页。

  • BabyAI: A Platform to Study the Sample Efficiency of Grounded Language Learning (Chevalier-Boisvert et al.):一个和OpenAI Gym兼容的平台,具备一个手工制作的bot agent,该智能体可以模拟人类教师指导智能体学习合成语言。

我对这两篇论文的想法和AnonReviewer4一样:

「……这里提出的方法和语义解析文献中研究的方法非常类似,尽管这篇论文仅引用了最近的深度强化学习论文。我认为作者会从语义解析文章中受益良多,语义解析社区也可以从这篇论文中得到一些启发……但是这两个社区实际上交流并不多,即使在某些情况下我们研究的是类似的问题。」

确定性有限状态自动机(DFA)也有两篇论文登上了ICLR 2019的舞台:

  • Representing Formal Languages: A Comparison Between Finite Automata and Recurrent Neural Networks (Michalenko et al.)

  • Learning Finite State Representations of Recurrent Policy Networks (Koul et al.)

两篇论文的主要动机是,因为RNN中的隐藏态空间很大,是否有可能把状态数量减少到有限的数量?我质疑DFA是否能够有效地在语言中代表RNN,但我很喜欢在训练阶段学习RNN,然后把它转换到DFA进行推理的想法,如同 Koul等人的论文所示。结果得到的有限表征在游戏Pong中只需要3个离散记忆状态和10个观察状态,它也能帮助解释RNN。

从RNN学习一个DFA的三个阶段(koul等人)。


提取自动机(Koul等人)

4. RNN失宠

2018到2019年的提交论文主题变化反映出:RNN出现大幅下降。这也在意料之中,因为RNN虽然适用于序列数据,但也存在极大缺陷:它们无法并行化,因而无法利用2012年以来最大的研究驱动因素——算力。RNN在计算机视觉和强化学习领域并不流行,而在一度流行的自然语言处理领域,它们也正在被基于注意力的架构取代。

RNN失宠。(图源: ICLR 2019补充统计数据)

这是否意味着RNN将死亡。并非如此。ICLR 2019的最佳论文之一《 Ordered neurons: Integrating tree structures into Recurrent Neural Networks》 就和RNN有关。除了这篇最佳论文和上文提到的两篇关于自动机的论文以外,ICLR 2019还接收了9篇关于RNN的论文,其中大部分研究深入挖掘RNN的数学基础知识,而不是探索RNN的新应用。

在工业界,RNN仍然很活跃,尤其是处理时序数据的公司,比如贸易公司。而不幸的是,这些公司通常不会发表自己的研究。即使现在RNN对研究者不是那么有吸引力,我们也知道未来它可能「卷土重来」。

5. GAN仍然势头强劲

相比去年,GAN的相对变化呈负数,但相关论文的数量实际上有所增长,从大约70篇增长到了100篇左右。Ian Goodfellow 受邀发表了以GAN为主题的演讲,一如既往受到了众多关注。

ICLR 2019第一个poster session是关于GAN的。出现了很多新的GAN架构、对已有GAN架构的改进,以及GAN分析。GAN应用囊括图像生成、文本生成、音频合成等多个领域,有 PATE-GAN、GANSynth、ProbGAN、InstaGAN、RelGAN、MisGAN、SPIGAN、LayoutGAN、KnockoffGAN等不同架构。

GAN poster session揭示了社区对GAN的反应是多么地两极分化。一些非GAN研究者如此评论:「我等不及想让GAN这波风潮赶紧过去」、「一有人提到对抗,我的脑子就宕机。」他们可能是嫉妒吧。

6. 缺乏生物启发式深度学习

鉴于大家对基因测序和CRISPR婴儿的忧虑和讨论,ICLR竟然没有出现很多结合深度学习和生物学的论文,这令人惊讶。关于这个话题一共有6篇论文:

两篇关于生物启发式架构:

  • Biologically-Plausible Learning Algorithms Can Scale to Large Datasets (Xiao et al.)

  • A Unified Theory of Early Visual Representations from Retina to Cortex through Anatomically Constrained Deep CNNs (Lindsey et al.)

一篇关于RNA设计:

  • Learning to Design RNA (Runge et al.)

三篇关于蛋白质控制(protein manipulation):

  • Human-level Protein Localization with Convolutional Neural Networks (Rumetshofer et al.)

  • Learning Protein Structure with a Differentiable Simulator (Ingraham et al.)

  • Learning protein sequence embeddings using information from structure (Bepler et al.)

受视网膜启发的卷积神经网络 (Lindsey et al.)

没有一篇论文是关于基因组学的,也没有一个workshop是关于这个话题的。这挺让人难过的,不过对生物学感兴趣的深度学习研究者或对深度学习感兴趣的生物学家而言,这是一个巨大的机会。

7. 强化学习仍然是提交论文中最热门的话题

ICLR 2019大会上的研究论文表明强化学习社区正在从无模型方法转向样本高效的基于模型的算法和 元学习 算法。这种转变很可能受到 TD3 (Fujimoto et al., 2018) 和 SAC (Haarnoja et al., 2018) 设置的Mujoco连续控制基准上的极高分数,以及 R2D2 (Kapturowski et al., ICLR 2019) 设置的Atari离散控制人物上的极高分数的启发。







请到「今天看啥」查看全文