翻译 |AI科技大本营(微信ID:rgznai100)
一直为开发者提供优质学习资源的Mybridge最近又发布了一篇资源性文章:《2018年2月机器学习10大热文精选》 ,这10篇文章是Mybridge是对近期发布的1400篇文章进行了排名并挑选出来的。为了让开发者对文章有更直观的了解,营长对这10篇资源进行了摘要式翻译。
以下文章讨论的话题主要包括:张量生成库,Deepfakes,神经网络,深度强化学习,语音,DMLab-30,医学图像分析,歌词分析,IRL等。
(此前营长发布过多篇收藏党喜欢的文章,也是来自Mybridge:①Python 开源项目 Top 10 精选,平均star为1128! ②从1400篇机器学习文章中精选出Top 10,帮你找找上班的感觉! ③ 从15000个Python开源项目中精选的Top30,Github平均star为3707,赶紧收藏! ④我们从8800个机器学习开源项目中精选出Top30,推荐给你)
▌No.1 张量生成库(Tensor Comprehensions),由Facebook研究院提出。
Tensor Comprehensions是一个多功能的C++库,利用Halide、ISL、NVRTC和LLVM框架,它能够自动合成高性能的机器学习内核。此外,张量生成式库提供了底层接口,能够与Caffe2、PyTorch框架无缝衔接,实现很好的兼容性。更多关于该库的细节,我们将在论文中进行详细说明,论文已发表在arXiv上。
Tensor Comprehensions作为一种全新的机器学习框架,它具有高度的便携性,能够轻松地嵌入到其他设备上运行。不仅如此,它还兼具内存空间占用少,易分流,同步性好等优点,只需要一个简单的张量库就能满足需求。
▌No.2 如何利用deepfakes生成逼真的人脸照片。由 Sven Charleer提供。
Deepfakes是一个基于深度学习算法的应用程序,它能够自动学习如何构建人脸。给定一系列的人脸图片,经过数个小时,它就能够逼真地生成这些人脸图片。值得注意得是,它并不是简单地生成这些图片的副本,而是通过学习这些人脸各自的构造,不同的表情来生成相应的人脸。
▌No.3 如何使用CoreML、PyTorch和React Naive框架在iOS系统中搭建神经网络。由Stefano J.Attardi提供
这篇文章我主要阐述如何在iOS系统中使用一个已训练好的神经网络来解决真实世界的问题。这些挑战在每个iOS应用程序中都会出现的。
下面,我将从问题入手详细说明每个问题的解决方案。首先,我们要逐步完成工具构建,数据集生成,神经网络模型的构建和在PyTorch上进行模型训练。 进一步,我们还将在CoreML上进行模型转换,最终到达React Native UI。
▌No.4 深度强化学习将不再有效。由Alexirpan提供
在过去几年里关于强化学习的研究,被引文章次数最多的高校或研究机构包括加州大学伯克利分校,Google Brain,DeepMind和OpenAI,我也是其中工作的参与者之一。这篇文章列举了多则关于深度强化学习弊端和局限性的内容。此外,在这份表单里我可能遗漏掉其他一些机构的研究成果,在此表示歉意。
▌No.5 前端要完?人工智能已经能实现自动编写 HTML 和 CSS。 由Emil Wallner提供。(中文版)
在未来三年内,深度学习将改变前端开发,它可以快速创建原型,并降低软件开发的门槛。
去年,该领域取得了突破性的进展,其中 Tony Beltramelli 发表了 pix2code 的论文[1],而 Airbnb 则推出了sketch2code[2]。
目前,前端开发自动化的最大障碍是计算能力。但是,现在我们可以使用深度学习的算法,以及合成的训练数据,探索人工前端开发的自动化。
本文中,我们将展示如何训练神经网络,根据设计图编写基本的 HTML 和 CSS 代码。
▌No.6 用生成对抗网络实现语音合成。由 Chris Donahue提供
虽然生成对抗网络(GAN)在图像合成问题上已经取得了广泛的成功,但还未在无监督式的音频生成领域中得到应用。
与图像不同的是,解决音频合成问题的一大障碍是区别不同音频之间的表示法往往是不可逆的,因此这种表示法不能用于合成音频输出。 在本文中,我们介绍一种WaveGAN模型,这是第一次尝试在无监督的设置下将GAN应用于原始音频合成问题。 实验结果表明,WaveGAN可以利用人类言语中的小词汇生成可理解的词汇,进一步地,这种方法对于其他领域的音频合成问题同样适用,例如鸟鸣,鼓声和钢琴声。
我们的研究还表明,WaveGAN模型是生成对抗网络在音频特征表示问题上成功的应用,这对于人类法官的案件审判有很大的帮助。关于模型的详细信息可参见我们这篇论文:arxiv.org/pdf/1802.04…
▌No7. IMPALA:DMLab-30环境下的一种可扩展的分布式深度强化学习框架。 由DeepMind提供
DMLab-30是我们使用强化学习环境DeepMind Lab设计的一种全新的强化学习框架。在这些环境下,深度强化学习的研究人员都可以在单个或多任务设置中对感兴趣的一些问题进行研究,并系统地测试。
▌No.8 深度学习在大脑磁共振图像问题中的应用。 由Henrik Marklund提供
这篇文章中我们将详细讨论医学图像分割问题,其内容主要有以下几个方面:
图像分割问题
脑磁共振图像数据
脑图像分割问题所需面临的三大挑战
脑肿瘤图像分割挑战赛
医学上损伤图像分割实例分析(已达人类医生水平)
▌No.9 R语言在自然语言处理和机器学习领域的应用:用于歌词合成分析。由 Debbie Liske提供
这是该系列教程的第一部分,在这篇文章中你将学习如何使用R语言对传奇艺术家Prince的音乐歌词进行研究分析,包括歌词文本的挖掘,情感分析等。 这系列教程涵盖以下三个部分的内容:
第一部分:对歌词进行文本挖掘和探索性分析
第二部分:用自然语言处理的知识对歌词进行情感分析和主题建模
第三部分:用机器学习进行预测分析
▌No.10 反转式强化学习。 由Johannes Heidecke提供
在该系列文章中,我们将详细研究反转式强化学习(IRL)。它是通过观察动作或行为特征来学习代理的目标,价值或奖励的一种学习策略。 例如,我们可以观察一个人在某个特定任务中的行为,并了解人类试图要达到的环境状态及具体目标可能是什么。
这是本系列文章的第一部分,我们首先将介绍IRL的概念,并进一步阐述解决IRL问题的三种基本算法。在后面的文章中,我们将探索更先进的技术和最先进的方法。