概要:我们的大脑都拥有一种非凡的技能:一种能够解释一件事与另一件事之间关系的能力。
来源:网易智能
几乎每本警察小说都有一个经典的场景:一个饱经风霜的侦探站在墙上盯着一组照片。红纱牵扯着案件中的每一个角色,显然有些东西被遗忘了。在突然闪现的灵感中,最后的环节跳入侦探的脑海。他冲了出去,疯狂地对他的同伴大喊,他终于弄明白了“是谁”!
尽管我们并非都是经验丰富的侦探,但我们的大脑都拥有一种非凡的技能:一种能够解释一件事与另一件事之间关系的能力。
这种逻辑上的“杂技”被称为“关系推理”,通常在最日常的情况下默默运行:什么时候能在多辆迎面驶来汽车的时候安全地穿过马路?哪个菜和葡萄酒最搭配?住的酒店周围有多少景点?
对一个人来说,对两者之间关系的推理直观又简单。但对于人工智能来说,这是难以理解的。
这种情况可能会发生改变。上周,前沿人工智能企业DeepMind的研究人员发表了一篇论文,详细介绍了一种新的算法,它使得机器具有人类智慧。
即插即用的“关系网络”(RNs)是一种代码,它迫使人工智能明确地思考一组心理表征之间的关系——静态的物体、移动的人,甚至还可以是抽象的概念。
就像一个强大的涡轮充电器,结合现有的机器学习工具,RNs给了人工智能一个逻辑上的提升,以至于人工智能在一些基于图像的推理任务中表现得比人类还要出色。
哈佛大学计算神经学家SamGershman博士说,作为“人类智能的基本组成部分”,关系推理就像一个多功能工具,将技术从一个领域转移到另一个领域,他没有参与这项研究。
虽然RNs只捕获了人类推理的一小段,但它仍是朝着具有人类思维灵活性和效率的人工智能的“正确方向”。
思考快与慢
并非所有人工智能都是一样的。同艺术专业或科学专业的学生一样,这两种主要类型的人工智能——符号性和统计性——都有各自特点。
具有符号性的人工智能用一套强大的数学运算来解释事物之间的关系,所以他们以逻辑处理。但问题在于,它们会受到预先设定规则的制约。换句话说,任务中的任何微小变化都会让它们偏离原来的轨道,这并不是在这个日新月异世界里,解决我们所面临挑战的理想方法。
相比之下,统计性人工智能(更广为人知的是机器学习)依靠数以万计的例子来寻找数据集中的模式。统计性人工智能典型代表是“深度学习”,AlphaGo背后的主要动力,席卷全球的各种脸部识别技术。
然而,尽管它们具有革命性的意义,但深度神经网络在数据结构中发现复杂关系的能力仍然很糟糕,特别是它们没有足够学习样本。
关系网络
DeepMind将他们的新算法两全其美地结合:一个人工神经网络,能够对这些模式进行模式识别和推理。
人工神经网络是零散地基于我们大脑中的生物神经网络。他们不按照预先设定的规则操作,而是通过调整“神经元”之间的连接来寻找正确模式,就好比对吉他进行微调。
每个神经网络都有自己的结构来支持一项任务:标记图像、翻译语言,或玩围棋和Atari游戏。DeepMind的“关系网络”与此类似:它拥有一个特殊结构,可以“启动”它来分辨系统中每一个可能的对象。
研究报告作者TimothyLillicrap说:“我们明确推动RN来发现这些物体之间的关系。”他补充说:“计算关系的能力被结合到了RN体系中。”
即插即用性
在一系列的实验中,团队仔细地测试了RN的能力。首先,他们在CLEVR上训练算法——这是一个由简单对象组成的图像数据库,旨在明确地探索人工智能执行多种类型推理的能力,如计数能力、比较能力或查询能力。
在每个图像中,算法都必须回答一个场景中物体之间的关系问题。例如,“在黄光面和灰色球后面的小物体是什么形状?”或者“在大红色方块或绿色球前面有多少个物体?”
对人类来说,其实就是一个两步过程的简单算法。为了得到正确结果,你首先需要识别这些物品并描述它们的属性。然后,你必须把它们都放到一个更广泛的背景中去建立关于它们是什么又如何相互联系的假设。
但RN在整个过程中并不是单独进行的。为了解决这个问题,作者将其与另外两个神经网络相结合:一个用于图像处理,另一个用于解释问题。经过一轮轮训练后,算法网络回答的正确率是96%,超过了92%人的得分。没有RN模块的传统神经网络大程度上落后,正确率约63%。
DeepMind接着更换了装备,并在一个基于词汇判断的任务上测试了RN,以判断其多功能性。RN会接触一些短故事,比如“桑德拉拿起足球”,“桑德拉去了办公室”,进而引出一个问题,“足球在哪里?”
在大多数任务中,强化版RN表现出色,在95%任务组都表现得很好,尤其在推理的问题上更为突出——“狗是黑色的猎鹿犬;猎鹿犬的名字是小天狼星;小天狼星是什么颜色的?”——得分是传统RN的两倍。
最后,该算法对10个弹跳球的模拟进行了分析,其中一些随机选择配对,就好像被看不见的弹簧或刚性约束所束缚。通过分析球的相对位置和速度,该RN识别了90%以上的连接对。
更深层次的关系
RN的美妙在于其简单性。算法的核心是一个单一的等式,这意味着它可以被添加到现有网络结构中,以提高计算效果。强化版RN网络体系有一天可以自动分析监控录像,研究社交网络,或者引导自动驾驶汽车通过复杂的交叉路口。
也就是说,RN只分析了逐对之间的配对。为了真正理解更复杂的关系结构,它们必须对三元、四元或(更多元)成对组合进行比较。虽然这在一定程度上涉及移动对象,但它并不能预测研究目标的未来轨迹,这也是关系推理的一个关键部分。
研究报告的作者AdamSantoro说:“要解决更丰富的现实世界数据,还有很多工作需要做。”
DeepMind已经在这个问题上取得了进展。
在另一篇论文中,他们描述了一个“视觉互动网络(VIN)”,它预测了移动对象的未来,基于它们的属性和物理环境,就像建立在我们大脑中的一种物理引擎。
DeepMind团队在一篇博客文章中写道,在多样化的系统中,VIN精确地预测了移动对象“未来数百步”将会发生什么。这两项研究都表明,通过将世界分成物体和物体之间的关系,可以给人工智能一种概括能力。两位作者解释道,人工智能新学会了组合表面上看起来可能很不一样,但有潜在的共同关系的对象。
虽然这并不是智能的唯一方面,但确是至关重要的一方面。
来源:网易智能
欢迎加入未来科技学院企业家群,共同提升企业科技竞争力
一日千里的科技进展,层出不穷的新概念,使企业家,投资人和社会大众面临巨大的科技发展压力,前沿科技现状和未来发展方向是什么?现代企业家如何应对新科学技术带来的产业升级挑战?
欢迎加入未来科技学院企业家群,未来科技学院将通过举办企业家与科技专家研讨会,未来科技学习班,企业家与科技专家、投资人的聚会交流,企业科技问题专题研究会等多种形式,帮助现代企业通过前沿科技解决产业升级问题、开展新业务拓展,提高科技竞争力。
未来科技学院由人工智能学家在中国科学院虚拟经济与数据科学研究中心的支持下建立,成立以来,已经邀请国际和国内著名科学家、科技企业家300多人参与学院建设,并建立覆盖2万余人的专业社群;与近60家投资机构合作,建立了近200名投资人的投资社群。开展前沿科技讲座和研讨会20多期。 欢迎行业、产业和科技领域的企业家加入未来科技学院
报名加入请扫描下列二维码,点击本文左下角“阅读原文”报名