专栏名称: AI开发者
AI研习社,雷锋网旗下关注AI开发技巧及技术教程订阅号。
目录
相关文章推荐
爱可可-爱生活  ·  【[495星]Local Deep ... ·  昨天  
爱可可-爱生活  ·  //@爱可可-爱生活:欢迎参与!//@爱可可 ... ·  2 天前  
黄建同学  ·  //@硅谷亨特:刚才花了5min试了一下,确 ... ·  3 天前  
云头版  ·  DeepSeek 部署大单,运营商们冲啊! ·  3 天前  
黄建同学  ·  给 MCP 做的App Store 也来了 ... ·  3 天前  
51好读  ›  专栏  ›  AI开发者

深度学习的光环背后,都有哪些机器学习的新进展被忽视了?

AI开发者  · 公众号  · AI  · 2020-02-02 17:12

正文

点击上方“蓝字”关注“AI开发者”



来源 | Reddit ML 版
编译 | 杨晓凡
从神经网络被学术界排挤,到计算机科学界三句话不离人工智能、各种建模和预测任务被深度学习大包大揽,只不过短短十年时间。 这十年里我们目睹了 dropout、SGD+动量、残差连接、预训练等等深度学习技术的大爆发,见证了学术研究全面拥抱深度学习,也听到了对深度学习不足之处的质疑之声、感受到了很多人对非深度学习方法「复兴」的期盼。
reddit 上近期就出现了一个帖子,把网友们聚起来聊聊除了神经网络之外的机器学习方法的新发展,以及可以和各种模型配合、不仅限于改善神经网络的概念和模型。 也许这些现在并不热门的研究里就埋下了下一次机器学习革命的种子,就像十年前研究神经网络的学者们在冷落中迎来了革命的黎明一样。
下面我们整理了一些言之有物的网友回答。

高斯过程 Gaussian Processes

高斯过程并不是近期新发明的技术,但它近几年有重大发展,尤其是在技术的实现和拓展性方面。 相比于神经网络,高斯过程的特点在于:
  • 更直观,可解释性更好(有句调侃是「高斯过程就是一组平滑器」),有更多的数学工具描述它的行为;

  • 很高效,只需要很少的样本和计算资源就可以学习;

  • 可以方便地融合先验知识,凭直觉设定一组参数之后,很可能不需要训练就可以得到不错的预测结果;

  • 天然地符合贝叶斯法则。

高斯过程的研究里也融入了许多有价值的数学发现,涉及线性代数、概率、谐波分析等等。 GPytorch 是一个了解高斯过程领域最优秀模型的好去处。
高斯过程的主要不足在计算方面,训练和推理过程中一般都需要计算行列式和轨迹,或者从很大的矩阵中解算系统,存储空间的需求按列长度的平方增长,而计算的时间复杂度为 O(n^3)。 近几年的进展也主要来自于更高效的算法或者近似计算方法(比如 KISS-GP、SKI、LOVE 等等)

基因算法 & 演化策略 Genetic Algorithms & Evolution Strategies

离散演化训练是用基因算法配置网络结构,然后让得到的模型学习。 它的一个动机来自于,在复杂环境中为稀疏的回报归因是非常困难的,所以不如完全抛弃梯度,转而采用计算更高效的演化策略,反倒可以在模型设计和参数搜索方面获得更大的灵活度、取得更好的结果。 其中采用的和大自然中的生物演化类似的「随机突变+方向性选择」的做法也规避了当前的强化学习中的一些问题。
谷歌大脑的研究员 David Ha 在这个领域做了许多研究,他也撰写了易懂的介绍博客、配上了生动有趣的动图,可以点击 这里 详细阅读。也可以参见我们 前一天的文章对神经进化的介绍

因果推理 Causal Inference

Judea Pearl 是这条路线的代表人物,Yoshua Bengio 等学者也加入了探索当中,并且在想办法把它和现代机器学习结合到一起。 提到这个方向的这位网友表示,他的一位做数据科学的好朋友的工作内容里就已经越来越多地涉及到因果推理,而且他认为因果推理带来的革命在日后看来可能会比深度学习革命的影响更为深远。 接着他做了详细的解释:
首先要知道的是贝叶斯网络。 1980 年代的时候,Judea Pearl 正在探索各种能对人工智能领域的发展起到帮助的路线,贝叶斯网络的发明就有一部分功劳是他的。 但是贝叶斯网络也有一些限制,它能在低维空间高效地捕捉联合概率分布,但是说到底它也只能回答一些可观测的问题。 比如,给定了一些消费者的属性,基于其它消费者的行为,预测这些消费者在未来六个月内不再继续使用某个服务的概率。
但值得研究的问题还有很多。 理想情况下,如果你要采取一些行动干预某个系统,你会希望能够了解系统会发生哪些变化(由于行动干预)。 沿着刚才消费者的例子说,如果把他们加入一个为了提高顾客忠实度和互动程度而设计的自动发送促销邮件的清单里,他们不再继续使用服务的概率会如何变化? 这时候你需要思考的就是,给定了已知的消费者信息,也指定了要不要用某种方式干预之后,得到的结果会如何变化。






请到「今天看啥」查看全文