上个月,Facebook发布了一款图像识别软件,只要看一眼照片,就能识别出图中是猫咪还是狗狗。另一个类似的程序则能像训练有素的皮肤科医师一样,鉴别癌性皮肤病变。此类技术都是基于人工智能领域的一种先进算法——神经网络(Neural networks)。
然而,即使是神经网络的开发者,也无法准确的直到它们是如何工作的。如今,研究者找到了一种方法来“观察”神经网络的活动,看它们是如何形成结论并做出决策的。
人工神经网络源于对大脑多层级神经元协同工作的模拟。它们并非焊死的电路,只求算出特定的结果,而是像人脑一样会“学习”——进行数据训练、为多种输入信息建立联结并强化之。
一个神经网络可能同时拥有两层神经元:一层负责观察图片的像素点,另一层负责观察物体的边缘,例如人像与背景之间的分界轮廓线。在经过成千上万的训练后,神经网络会逐渐形成一套自有的图片识别规则。但是,我们却并不清楚这套规则。
Wojciech Samek是柏林弗劳恩霍夫通信技术研究所(The Fraunhofer Institute for Telecommunications)的研究人员,他认为:“神经网络是非常迷人的数学模型,在许多领域完胜传统的数学模型,但用起来常常跟黑箱差不多,根本不知道内部机制是什么。”
为了解锁这个黑箱,一探神经网络的工作机制,Samek和他的同事们发明一套方法,可以回溯整个神经网络,从而探知每一步决策是何时作出,对最终结果的影响分别有多大。
本月在德国汉诺威举行的CeBIT信息及通信技术博览会将会详细讲解该方法,届时,研究人员就能够测量单个输入(例如像素)对总体结论的影响有多大,从而为其标注权重。使用这些信息,研究人员就能为图像蒙上一层权重的面具:明亮部分的像素权重大,黯淡部分的像素权重小,几乎无法影响神经网络的输出。
例如,有两个神经网络都在训练识别图片中的马,一个依据物体形状来判断,一个则通过查看图片上有没有马业协会网站相关的版权符号来判断。
Samek认为,采用他们研发的方法,能提高这两个神经网络的表现。首先,通过关注神经网络究竟需要何种数据,就能大大减少其对海量数据的依赖——这也是目前困扰人工智能领域的最大问题之一。其次,该方法有助于发现错误的识别结果,比如把图中的物体误归为其他类别。
其他的研究者也在研究神经网络的决策机制,包括图像识别、语义判断等神经网络的工作原理。哈佛大学Berkman Klein 社会与互联网中心的科技评论员Sara Watson认为,随着神经网络在人们日常生活中做出的决策越来越多,对神经网络决策机制的研究也越来越重要。公众需要知道人工智能是如何做决定的。算法本身并不能够永远做出正确的判断,因为神经网络的表现取决于训练它时所用的数据。
谷歌的相册应用曾将照片中的一位黑人女性标记为黑猩猩,引发恶评如潮。另一款用以判断犯人是否可能再犯的软件,则在司法领域引起了更严重的歧视。至少有一篇分析指出,在同样的罪行下,软件会判断黑人被告比白人被告更容易成为惯犯。Watson评论道:“发明和使用人工智能的机构应当意识到,它们要为机器做出的判断负责。”
参考:http://www.sciencemag.org/news/2017/03/brainlike-computers-are-black-box-scientists-are-finally-peering-inside
《麻省理工科技评论》中美合作“城郭会员计划”正式发布,让您始终处于新兴技术商业趋势的最前沿。详情请点击下方图片查看↓↓↓
招聘
编辑、视觉设计、视频策划及后期
地点:北京
联系:[email protected]
MIT Technology Review 中国唯一版权合作方,任何机构及个人未经许可,不得擅自转载及翻译。
分享至朋友圈才是义举