古德费洛正是在蒙特利尔的酒吧想到GANs的。那晚,有朋友提及一个新的研究项目,即使用数学方法确定图像内容,再把所有数据输入计算机,使其自主生成图像。
带有几分醉意的古德费洛表示,这个想法永远不可能奏效,因为需要考虑的统计数据实在太多,没人能把它们全都记录下来。
但就在那时,他突然想到一个更好的方法:让神经网络来教导机器生成逼真的图像。
神经网络是一个复杂的数学系统,它通过分析大量数据来学习处理工作任务,比如说识别照片中的面孔以及理解口头语言。
古德费洛在那间酒吧里想到,当一个神经网络学习生成逼真图像时,另一个神经网络可以扮演它的对手,试着判定图像的真假。
古德费洛表示,通过这种方法,它最终可以教会第一个神经网络生成以假乱真的图像。
争论随之而来。古德费洛的朋友同样坚称,这种方法不会奏效。于是,在晚上回家之后,古德费洛构建了GANs。
“我到家后还有点醉醺醺的,我的女朋友已经睡着了。我坐在那里想:‘酒吧里的那些朋友是错的!’”他回忆道,“我熬夜在笔记本电脑上写出了GANs的代码。”
古德费洛声称,自己的代码在首次测试时就正常运行了。“那真的非常非常幸运。”他说,“因为如果没有运行起来,我可能就放弃了这个想法。”
当年晚些时候,古德费洛和其他一些研究者共同发表了一篇论文,阐述这个想法。在那之后的三年,又有数百篇论文对GANs的概念进行了探讨。
在那第一篇论文中,古德费洛描述了两个神经网络,它们构成一个系统,可以生成出手写数字的逼真图像。
现在,研究者正把该想法应用于所有图像,从猫到火山再到整个星系,无所不包。GANs甚至对天文学实验提供了帮助,被用于粒子物理学的模拟。
不过,GANs仍然是非常难以实现的事情,它需要同时训练两个神经网络,而不仅仅是一个。
在谷歌,古德费洛成立了一个聚焦于GANs和相关研究的新团队,他希望改进这个过程。
古德费洛说,我们将能拥有好得多的服务。它们不仅能更好地生成图像和声音,而且能更好地识别图像和声音,从而走向一种不需要太多人类帮助就能学到更多知识的系统。
GANs甚至可以实现如今还不存在的无监督学习。
目前,神经网络可以通过分析数百万张猫的照片来学习识别猫,但研究者不得不仔细甄别这些照片,并进行标记。
人类仍然需要深度参与其中,而这往往是一个问题,比如人类存在偏见,或者是训练人工智能需要庞大的人力劳动。
像勒丘恩这样的研究者,他们正在推动不需要如此多人类参与就能进行学习的系统,这将加速人工智能的进化。
不过,这只是开始。GANs同样带来了很多其他可能性。
南加州大学(University of Southern California)的人工智能研究员大卫·卡莱(David Kale)认为,这个想法可以帮助他和同事在不侵犯患者隐私的情况下构建医疗保健人工智能。
基本上,GANs可以生产假的医疗记录。然后,机器学习系统可以利用这些假数据进行训练,不再需要患者的真实病历。
“与其把患者医疗记录放在网上让所有人随意使用,我们为什么不先使用这些数据训练GANs,让它生成一个完全合成的数据集,再提供给研究者使用呢?”卡莱说,“我们为什么不这样做,好让任何通过这个数据集训练的模型都能匹敌通过原始数据训练的模型?”
虽然很多研究者都在探索GANs背后的想法,但古德费洛在谷歌内部组建专门团队这件事尤其引人注目。
他曾是从谷歌跳槽到OpenAI的研究者之一,后者承诺向全世界分享自己的研究成果。但不到一年后,古德费洛又重返谷歌,因为他的合作者都在该公司。
分享很重要,但紧密合作也是一样——不管你是人工智能研究者还是神经网络。
翻译:何无鱼
来源:WIRED
克里斯·霍斯默 | 为什么我能做个好设计,而你不能
顾卫红 | 医生可以成为生命科学时代的连接者
弓孟春 | 织一张连接罕见病大数据的网
黄卫人 | 把沉重的生命重新编程,跟上帝说一次NO
黄如方 | 谁来拯救罕见病人?是我们自己啊!
张振虎 | 所谓体验设计,到底设计的是什么?
孙晓曦 | 书有什么可设计的?
李若凡 | 我让朱棣唱RAP,让吴亦凡和你FaceTime
李三水 | 我不相信文字的力量
点击标题 查看往期回顾