专栏名称: 钱皓频道

从VC视角观察互联网新趋势，分析背后原因与影响的新媒体分析平台，已有80多万互联网从业者与投资人关注

深度：大脑如何思考？科学家正用机器学习解码人类智能

钱皓频道 · 公众号 · 科技自媒体 · 2017-01-08 20:11

正文

来源：机器之心（ID：almosthuman2014）编译

为什么我们需要人工智能协助研究人类的天生才智（natural intelligence）。

过去几年中，Jack Gallant 的神经科学实验室已经发表了一串听起来有些荒诞的论文。

2011 年，实验室证实，仅通过观察人类观影时的脑部活动，就可能再造电影片段。某种意义上，扫描观影人大脑再用计算机生成这部电影就像是读心术。类似地，2015 年，这个团队通过观察人类大脑活动成功预测了被试脑中勾勒着的名画。

2016 年，该团队在《自然》上发表了著名论文，宣布画出一万多个单个语词在大脑中的位置地图——方法是让被试收听 podcast 节目。

他们怎么做到的？研究人员使用了机器学习工具——一种人工智能——挖掘海量大脑数据、找到了大脑活动模式、预测人类感知。

不过，他们的目标并不是要打造一台读心机器。神经科学家对盗取藏在脑中的密码不感兴趣，也对那些见不得光的秘密不感冒。他们的目标更加远大。将神经科学转变为一种「大数据」科学，使用机器学习挖掘数据，Gallant 和该领域的其他科学家有可能革新我们对大脑的理解。

毕竟，人类大脑是宇宙中已知的最为复杂的东西，人类几乎搞不懂它。Gallant 实验室的雄心——让神经科学摆脱不成熟阶段——：或许可以打造出一台为我们解读大脑的机器。如果可以解码极端复杂的大脑模式，就有可能找出修复大脑的办法（当大脑深受疾病之苦时）。

MRI——我们用来窥探和分析大脑功能及其解剖学的工具——诞生于上世纪九十年代，效果透光不均匀。为了让效果透视化，fMRI 能够观察到的脑部活动最小单元到了体素（voxel）层面。这些体素通常小于 1 立方毫米。而一个体素中可能有 10 万个神经元。德克萨斯大学的神经科学家 Tal Yarkoni 告诉我，fMRI「就像飞过城市，找到哪里亮着灯。」

传统的 fMRI 成像可以呈现出对某个行为至关重要的广阔区域在哪里——比如，你可以看到大脑哪里处理负面情绪或者当我们看到熟悉面孔时，哪里会亮起来。

但是，你无法确切知道这个区域在行为中扮演什么样的角色，或者其他不那么活跃的区域是否也扮演着重要作用。大脑不是乐高玩具，每块玩具都有着特定的功能。大脑是一张活动之网。Gallant 说，「每个大脑区域会有 50% 的可能与大脑其他区域连接起来。」

这就是为什么简单的实验——识别「hunger（饥饿）」或者「vigilance(警觉）」所在大脑区域——无法真的得出让人满意的答案。

美国国家精神健康研究院（National Institute of Mental Health）fMRI 部门负责人 Peter Bandettini 告诉我，「过去十五年中，我们一直研究这些一团一团东西的活动。结果，每一团中细微差别、每一次波动的细微差别都包含着大脑运动的信息，而我们无法真正挖掘出来。这也是我们需要这些机器学习技术的原因。我们可以看到一团团的东西，却识别不出模式，因为这些模式太复杂了。」

举个例子。大脑如何处理语言？传统的看法是活动发生在左半球的两个特定区域——布洛卡区和威尔尼克区域——这是语言活动的中心区域。如果它们受损，人就会失去语言能力。不过，Gallant 实验室的博士后 Alex Huth 最近发现，这个观点太过简单。他想知道整个大脑是否都与语言理解相关。

实验中，他请几个被试听两个小时的故事节目 The Moth，与此同时，同事们用 fMRI 扫描仪记录被试大脑活动。他们想要将大脑不同区域与所听到的单个语词关联起来。

实验产生了很多数据，人力很难处理。Gallant 说。但是，可以训练计算机程序寻找数据中的模式。因此，Huth 设计了可以揭示出语义地图的程序，地图显示出每个语词所在大脑区域。

「Alex 的研究表明，语义理解需要动用大脑的大部分区域，」Gallant 说道。Alex 同时也展示了意义相似的单词（如 poodle 和 dog）在大脑中的刺激到的位置彼此靠近。

这个研究的意义何在？在科学里，预测就是力量。如果科学家可以预测让人眼花缭乱的大脑活动是如何进行语言理解的，他们就可以受此启发构建更高效的模型。而一旦新的模型被建立起来，他们就可以更好地认识变量改动后的情况——大脑出现病变时。

什么是机器学习？

「机器学习」是一个内容广泛的概念，包含了各类算法与系统。机器学习目前已经被大量应用到消费级产品中去了——例如让计算设备学会识别图片中的物体，其准确程度堪比人类。机器学习的一个分支「深度学习」是最近最为引人注目的词汇，这种技术已经让谷歌的翻译服务从生硬的单词翻译进化到可以把海明威的著作翻译成各国语言，同时保留原作风格的水平。

在最基本的层面上看，机器学习程序需要先使用数据集进行「训练」。在训练中，程序会在数据中寻找模式。通常来说，训练越多的数据，系统就会有更好的表现。一旦经过训练，在遇到同类型的数据之后，系统就可以展开预测了。

最常见的例子就是电子邮件中的垃圾邮件过滤程序。机器学习通过扫描足够数量的垃圾邮件，学习其中内容的特性，从而在收到新的邮件时帮你进行分析和拦截。

机器学习可以是非常简单的程序，仅仅进行数学回归运算（这只是中学数学知识，比如从一些已知条件中算出一条线段的斜率）；也可以是非常复杂的系统，就像谷歌 DeepMind，经过了数以百万条数据的训练，从而在围棋上打败人类世界冠军（围棋的棋局变化数量超过了宇宙中所有原子的数量）。

神经科学家正在使用机器学习进行着一些研究。如编码与解码。

通过「编码」，研究人员试图使用机器学习来预测不同刺激在大脑中造成的影响。

「解码」则与之相反，通过观察大脑活动来反推受试者正在思考什么。（注：神经科学家可以使用不同大脑扫描方式为机器学习提供数据，除了 fMRI 以外还有 EEG 和 MEG 等）

俄勒冈大学的神经科学家 Brice Kuhl 最近使用 fMRI 数据解码，重建了受实验者眼睛里看到的内容。

Kuhl 通过核磁共振成像研究的脑区一直被认为与人类记忆密切相关。「这个脑区的活动显示了你所看到物体的细节——或许仅仅是（点亮），因为它是你非常确定的记忆。」Kuhl 说道。机器学习程序可以从这个脑区的活动图像中预测被试者看到的人的面部特征，这表明这个位置就是「你看到的细节」被处理的地方。

第一行是 Kuhl 研究中的原始面孔；第二行是基于大脑的两个不同区域中的活动，机器学习进行的猜测，重建远非完美，但它们表现出了原面部的一些基本细节，如性别、肤色和表情

同样，Gallant 有关艺术作品的实验揭示了一个关于心灵的小秘密：当我们看到相同物体时，我们会激活大脑中相同的区域。

所有接受采访的神经科学家们都表示机器学习并没有彻底改变他们的领域。究其原因——没有足够的数据。扫描大脑活动需要花费大量时间，而且价格昂贵。同时，一项研究通常会招募几十名受试者，而不会有几百人。

「在 20 世纪 90 年代，神经影像学刚刚起飞时，人们关注类层面（category level）的表征——大脑的哪个部分处理人的面孔（而不是房子和物体），这是大尺度的问题，」匹茨堡大学的神经科学研究院 Avniel Ghuman 解释道。「现在我们可以研究很多细节上的问题，比如：这让他/她回忆起了十分钟前想到的同一件事吗？」

「这种进步是革命性的。」Ghuman 说道。

神经科学家希望机器学习可以帮助诊断和治疗精神障碍

目前，精神科医生还不能通过让病人接受 fMRI 扫描来确定他/她是否患有精神疾病（如精神分裂症）。他们仍然不得不依靠在临床上与患者进行对话（毫无疑问，这种方式获得的信息具有很大价值）。但机器学习带来的新型诊断方法将会让疾病的诊断更加准确，这无疑会给医疗领域带来新的进步。为了做到这一点，美国国家精神健康研究院（NIMH）的 Bandettini 表示，神经科学家们需要获得 10,000 份以上 fMRI 扫描结果的数据集。

机器学习程序可以从精神病人的大脑活动图像中寻找模式，学会进行识别。「随后你可以开始把它应用在临床上，扫描一个病人然后说：基于容量为 10,000 的数据集的训练，我们现在可以作出初步诊断，此人患有精神分裂症。」Bandettini 表示，现在，这些研究仍然处于初级阶段，新的突破还没有出现。

但是，如果我们理解了大脑中各区域组成的网络是如何工作的，这些方向很快就会转化为成果。「在未来，我们也许能设计复杂的干预措施在大脑出现病变时进行治疗，」MIT 计算神经科学家 Dan Yamins 说道。「也许我们可以把某种植入物放进大脑，用来治疗阿尔茨海默病，或者也可以治疗帕金森症。」

机器学习还可以帮助精神科医生预测不同患者的大脑会如何对抑郁症的药物治疗产生反应。「现在的精神病医生不得不猜测，从诊断角度来看，哪种药物可能是有效的，」Yamin 说道。「因为有时症状并不能说明大脑中发生的一切。」

但 Yamin 同时指出，这些愿景可能很长一段时间都无法实现。很多科学家们现在正在思考这些问题。NeuroImage 期刊曾出版过一个专刊登载预测个体大脑差异和神经影像学诊断的论文。

这是非常重要的研究方向，因为当涉及到医疗领域时，预测为治疗和预防疾病带来了新思路。

机器学习可以预测癫痫发作

癫痫病的患者永远无法得知自己将在何时发病。「这对你的生活来说是致命的——你不能开车，不能正常生活，因为你随时有可能发病，」国立卫生研究院的神经科学家 Christian Meisel 说道。「如果拥有一个预警系统，一切都将会不同。」

目前人们对癫痫病的治疗方式也不甚完美。一些患者不得不 24 个小时不断服用抗惊厥药物，而这些药物具有严重的副作用。而对于 20%-30% 的患者来说，没有任何药物对他们有效。

用预测来改变这一切。

如果癫痫患者知道癫痫发作即将来临，他们至少可以提前找到一个安全的地方。预测还可以改变治疗方式：提前警告可以告诉患者快速服用癫痫药物，或发送电信号以阻止其即将出现的发作。

这是一个 EEG——脑电图图像——Meisel 分享了一个癫痫病人的例子。「现在是没有癫痫发作的情况，」Meisel 说道。「问题是，这种情形距离发病有一小时还是四个多小时？」

对于临床医生来说，预测是非常困难的，他说，甚至是不可能的。

但关于一场即将发作的癫痫的信息可能隐藏得非常微妙。为了测试这种可能性，Meisel 的实验室最近参加了一个由网络上的数据科学社区中心 Kaggle 主办的比赛。Kaggle 提供了三位癫痫患者的几个月和几年的 EEG 记录。Meisel 使用了深度学习来分析这些数据并寻找其中的模式。

根据癫痫的前奏的 EEG 扫描来预测癫痫发作，这能够做到多好？「如果你有一个可以预测一切的完美系统，你得 1 分。」Meisel 说，「如果你只有一个抛硬币的随机系统，你得分 0.5。而我们现在的得分是 0.8。也就是说我们的系统现在并不能做到完美预测，但却比随机好很多。」（这听起来似乎不错，但目前这个方法更多还是理论上的，并不实用。这些患者是通过颅内 EEG 监测的，这是一种侵入式操作。）

Meisel 是一位神经学理论学家，绘制了癫痫发作病症如何从小型的神经活动发展成完全的衰竭型行为的模型。他说，机器学习是帮助他改善其理论的有用工具。他可以将自己的理论引入到机器学习模型中，观察它是否使得系统更具预测性。「如果有效，那我的理论就是正确的。」他说。

从机器学习到真正有用，神经科学将需要变成一种大数据科学。

机器学习并不能解决神经科学领域内的所有大问题。它可能会受限于来自 fMRI 和其它脑扫描技术的数据的质量。（最好的也就是 fMRI 绘制出的大脑的模糊影像。）「就算我们有无限的成像数据，你也不能得到完美的预测，因为这些成像流程本身是非常不完美的。」计算机科学家 Gael Varoquaux 如是说，他已经开发出了一款用于神经科学的机器学习工具包。

但至少我访问过的神经科学家都对机器学习感到兴奋，因为机器学习有利于实现更干净的科学（cleaner science）。机器学习解决了所谓的「多重比较问题（multiple comparison problem）」，其中研究者的工作本质上是在他们的数据中挖掘出统计学上显著的结果（只要有足够的脑扫描数据，某些地方的一些区域就会「点亮」）。使用机器学习，不管你对大脑行为的预测是否正确，Varoquanx 说：「预测是你可以控制的东西」。

大数据的方法也意味着神经科学家可以在实验室之外开始自己的行为研究。「我们所有的关于大脑活动方式的传统模型都基于那些人工设置的实验环境」，Ghuman 说，「当涉及到真实世界环境时，我们并不完全清楚它是否还是有效。」如果我们有了关于大脑活动（也许来自可穿戴的 EEG 监测器）和行为的足够数据，机器学习就可以开始寻找将这两者联系起来的模式，而不再需要认为设置的实验。

在神经科学领域使用深度学习还有最后一个可能性，这听起来很科幻：我们在大脑上使用机器学习来开发更好的机器学习程序。过去十年机器学习领域内最大的进步是被称为「卷积神经网络」的思想。谷歌就是用这种技术来识别照片中的物体的。这些神经网络基于神经科学的理论。所以，随着机器学习在理解大脑上做得越来越好，机器学习本身也可以从中学习技巧，从而变得更加聪明。经过这样改进的机器学习程序又可以继续研究大脑，让我们可以更进一步地了解更多神经科学。

（研究人员也可以从机器学习项目中吸取洞见，比如训练机器学习重现视觉这样的人类行为的项目。可能在学习这些行为的过程中，这些项目能重现大脑做出行为的方式。）

Varoquanx 说，「我不想让人们认为我们突然开始研发大脑读取设备，事实不是这样。我们希望得到更丰富的计算模型，从而更好地理解大脑，这才是我们想要做的。」

原文链接：http://www.vox.com/science-and-health/2016/12/29/13967966/machine-learning-neuroscience