专栏名称: 新智元

智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响，领航中国新智能时代。

【重磅】灵长类动物脸部识别算法被破译，大脑黑箱或根本不存在

新智元 · 公众号 · AI · 2017-06-03 12:44

正文

新智元报道

来源：Nature；Cell；NYT

编译：文强

【新智元导读】发表在 Cell 的一项研究揭示了人脸识别的具体神经元活动过程。对猕猴的实验表明，对脸部的识别是由大脑中 200 多个不同神经元共同编码完成的，每个神经元会对一张脸不同特征的参数组合进行相应。这一发现推翻了此前人脸由特定细胞识别的假说。《纽约时报》报道称，机器学习给神经科学带来了一种悲观主义色彩，认为大脑类似黑箱，该论文则提供了反例：研究人员记录了视觉系统最高级的神经元信号，可以看到那里没有黑箱，我们完全可能揭开大脑的奥秘。

不必花费太多心思就从人群中找到熟识的脸，对于绝大多数人而言都是小事一桩。人类的大脑已经这样做了几百万年。

不过，这其中具体涉及的神经系统过程却十分复杂，研究人员也对其倾注了很多年的时间。

6 月 1 日，在 Cell 发表的一项研究表明，猕猴依靠一个数百个神经元组成的集群相互协调，发现某些物理特征，从而对动物的脸进行识别。这一发现也解决了一个多年以来一直困扰科学家的问题。

关于灵长类是如何识别其他动物，尤其是同类的脸，一直以来众说纷纭。美国马里兰州贝塞斯达心理健康研究所的神经科学家 David Leopold 在接受 Nature 记者采访时表示，最荒谬的观点是，对于每个认识的人，都有单个的细胞专门用于识别那个人的那张脸。

其他理论则认为，多个神经元构成的集群一起工作，从而识别一张脸。

图片来源：Nature

研究发现人脸识别新理论，单个神经元对一组特征编码

加州理工大学的神经科学家 Tsao 和 Le Chang 研究了两只猕猴（Macaca mulatta）的大脑，确定动物大脑中脸细胞（face cell）的位置。他们将人脸或其他物体的图像，包括身体、水果和随机图案展示给这两只猕猴看。然后，使用功能核磁共振成像（fMRI）查看，当这两只猕猴看到“脸”时，哪些脑区会被激活（亮起）。

接下来，他们专注于研究被激活的点，也就是所谓的“脸细胞”。Tsao 和 Chang 使用了一组包含不同特征的 2000 张人脸给猴子观看，这些不同特征包括眼睛之间的距离、发际线的形状等等。

然后，他们将电极植入猕猴的大脑中，比较各个神经元对面部差异的反应。

Tsao 和 Chang 记录了两只猕猴间共计 205 个神经元的反应。每个神经元都会对一些面部参数的特定组合产生相应。

视觉皮层神经元针对特意设计的人脸不进行响应，证明了论文提出的 Axis Model 确实存在

西雅图华盛顿大学视觉神经生理学家格 Greg Horwitz 在接受 Nature 记者采访时表示，Tsao 和 Chang 两人的工作可以简单概括为开发了一个模型，让人能从计算机屏幕上的图像中看到，视觉皮层中神经元对脸部的反应。

Horwitz 说：“这是一个巨大的进步。”因为这个模型描绘了每个细胞是如何对所有可能的面部特征组合产生相应的，而不仅仅是一个。

推翻此前假说，大脑不是“人脸识别机”，而是“人脸分析仪”

不仅如此，Tsao 和 Chang 还考虑了，在进行脸部识别，也就是识别各种面部特征的特定组合时，每个神经元是否有“最擅长”的一个组合。

他们根据每个神经元对其特征的反应，尝试重现猕猴看见的面孔，从而验证了这一想法。基于这些信号的强度，神经科学家几乎可以完美地重现真实的面孔。

实验中，当猕猴看到不同的脸部图像，但这些不同是神经元“不关心”的组合时，单个脸细胞的反应保持不变。

打个比方，当猕猴看见两张发际线不同的照片，它们视觉皮层中关心眼睛大小的神经元不会产生变化。

换句话说，“神经元不是人脸检测器，而是面部分析仪，”Leopold 告诉 Nature 记者，大脑“能够意识到一些关键的维度（dimension），可以分辨出这是人 A，这是人 B”。

论文作者 Tsao 表示，人的大脑可能会使用这个代码来识别或想象具体的面孔。

视觉皮层神经元针对特意设计的人脸不进行响应，证明了论文提出的 Axis Model 确实存在。来源：Cell 论文

每个脸细胞的调谐（tuning）都是面部维度的组合，是一个整体的系统，这也说明了为什么当某人把胡子挂掉时，他的朋友可能一开始注意不到，《纽约时报》的报道指出。

根据论文，需要大约 50 个这样的维度来识别一张脸。

这些维度构建了一张精神上的“面孔”，可以识别无数张脸。

《纽约时报》报道还表示，可能存在一张平均脸（或类似的东西），新遇到的一张脸可能一个特征（比如眼睛距离）在一个维度上平均偏离平均脸 5 个单位，而另外一个特征（比如发际线）在这个维度上则是偏离 7 个单位。

一张人脸可以分解为多个维度，而每个脸神经元大约会编码其中 6 个维度的若干参数，整合在一起就形成了一张整体的脸。

Tsao 在接受《纽约时报》采访时表示，她印象特别深刻的是，可以设计出一整套面孔，各种特征组合，而给定的脸细胞都不会发生响应，因为这些设计出的面孔都不是细胞“擅长”识别的维度的组合。

这也排除了此前的一种人脸识别假说——脸细胞将输入的图像与一组标准的人脸数据进行比较，并从中寻找差异，而后者正是此前计算机识别人脸时常用的一种方式。

论文中提出的人脸识别模型的示意图。来源：Cell 论文

不过，科学家目前仍然不确定一切是如何联系在一起的。

但是，能够肯定一点，Leopold 在接受 Nature 采访时表示：“这项研究为大脑实际上如何去分析单个的人提供了一个更实际的替代方法。”

《纽约时报》报道称，机器学习给神经科学带来了一种悲观主义色彩，认为大脑类似黑箱，该论文则提供了反例：研究人员记录了视觉系统最高级的神经元信号，可以看到那里没有黑箱。

也就是说，揭开大脑的奥秘是完全可能的。

接下来，就是人工智能要做的事情了。

论文介绍：亮点及概要

亮点

面部图像可以使用大约 200 个脸细胞（face cell）的反应进行线性重建
脸细胞显示（display）与被编码的轴在正交平面上平直调谐（flat tuning）
轴模型比样本模型更有效、鲁棒和灵活
面部结构（patch）ML/MF 和 AM 携带有关脸的补充信息

概要

灵长类动物以惊人的速度和可靠性识别复杂的物体，比如动物的脸。本文中，我们揭示了大脑进行面部识别的代码。猕猴实验表明，在面部结构中，面部和细胞反应之间存在着非常简单的转变。通过将动物的脸格式化为高维线性空间中的点，我们发现每个脸细胞的发射速率（firing rate）与入射面部刺激在该空间单个轴上的投影成正比，这样一来，一个脸细胞就能对空间中任何位置的脸进行集合编码。使用这个代码，我们可以精确地解码面部神经元群的反应，并预测关于动物脸的神经发射速率。此外，这一代码推翻了此前由来已久的假设，那就是脸细胞会对特定的面部特征进行编码。我们的研究表明，其他对象也可以由类似的度量坐标系统进行编码。

编译来源

Nature 报道：http://www.nature.com/news/neuroscientists-rethink-how-the-brain-recognizes-faces-1.22091
Cell 论文：http://www.cell.com/cell/fulltext/S0092-8674(17)30538-X?_returnURL=http%3A%2F%2Flinkinghub.elsevier.com%2Fretrieve%2Fpii%2FS009286741730538X%3Fshowall%3Dtrue
NYT 报道：https://www.nytimes.com/2017/06/01/science/facial-recognition-brain-neurons.html