专栏名称: DeepTech深科技

“DeepTech深科技”是与麻省理工科技评论官方独家合作的一个新科技内容品牌。我们专注于关注三个方面：1、基于科学的发现；2、真正的科技创新；3、深科技应用的创新。

这家最近大火的美AI初创公司，被美国防部DARPA定义为“第三次AI浪潮”的代表 | 独家专访

DeepTech深科技 · 公众号 · 科技媒体 · 2017-03-30 10:46

正文

请到「今天看啥」查看全文

本文属于本次Emtech Digital人工智能峰会独家精选。

Gamalon是最近大火的一家从事机器学习相关研究的初创公司，他们的核心技术Bayesian Program Synthesis（BPS）实现了让机器自主完成概率编程，而不再需要人工编写。技术公布后，甚至有媒体宣称机器学习的速度将可能提升百倍。

让机器自行完成概率编程

也正因如此，美国国防部高级计划研究局（DARPA）于不久前对Gamalon注资720万美元， 这笔投资是DARPA近年来投入金额最大的案例之一， 而且 Gamalon 的技术也被DARPA归为“第三次AI浪潮”。

美国当地时间 3 月 28 日，Gamalon创始人兼首席执行官Ben Vigoda在《麻省理工科技评论》于旧金山举办的Emtech Digital数字峰会上做了专场演讲， DT君随即也对Ben Vigoda 做了独家专访。

Ben Vigoda麻省理工科技评论EmTech Digital数字峰会上做演讲

这家被认为“可能会为AI发展带来颠覆式新方法”的公司到底有何独特之处？请见以下专访全文：

问：今天上午的演讲非常精彩，观众们对Gamalon研究人工智能的方式也非常有兴趣。你们所使用的“概率编程”（Probabilistic Programing）与目前基于大数据的深度学习方法非常不同，甚至可以说是基于“小数据”，在设定目标后，由机器去自主学习，会和强化学习有类似之处么？

答：其实和强化学习不太一样，杨立昆（Yann LeCun）有一个关于机器学习三种类型的精彩演讲。他认为， 机器学习就像一个蛋糕，上面点缀的浆果就是强化学习，非常美味，但是数量很少。

有点类似于你赢得或输掉了一个游戏，会有很强的体验感，但并不是经常发生。 然后，蛋糕上的糖霜可以看做是监督学习。 比如，在游戏中得分或死亡，这要比直接输掉或赢得游戏更常发生。

Yann LeCun的“机器学习蛋糕”

最后就是蛋糕本身了，我们称之为无监督学习，这类是最多的。 我们没有关于这些数据的反馈，也没人会为我们解释这些数据。比如，你通过机器学习来识别猫，首先得准备大量猫、狗的图片， 但并没有人告诉你哪些是猫、哪些是狗，这就是无监督学习。

但即便是在无监督的情况下，有些机器学习系统还是能分辨出猫和狗。 毕竟，猫都长得差不多，狗也长得差不多，而且猫和狗看起来不一样。

问：你是如何想到将“概率编程”应用于人工智能研究的？毕竟目前绝大多数的方法都趋于同质化。

答：非常好的问题！我个人的观点是， 人工智能的研究目前确实有同质化的问题。 目前最主流的方法，比如大家都在做的深度学习：分析海量的数据、调用大量的计算能力。 但如果大家都押宝在一种人工智能上，这对其发展是不利的。 原因是， AI目前所处的阶段还太早，根本无法判断那种方法会最终胜出。 在这个时候去推崇某一技术明显是有问题的。

Ben Vigoda 正在接受 DT 君专访

AI领域同样需要生态多样性。 某种程度上， Gamalon其实得益于目前在深度学习领域的大量投资，因为人们只会去关心一件事： 你能用深度学习做什么？ 我们反倒有了自己的发展空间。 于是，我们获得美国国防部高级研究计划局（DARPA）的投资。

回到你的问题， 为什么我们会尝试一条完全不同的 AI 研究路径？ 举例而言，吴恩达曾经想设计一套无人机飞控系统，他在编码时考虑到了流体动力学、空气动力学、机械工程等诸多问题， 但这套飞控系统还是无法正常工作。

有一天，他突然说，为啥不直接用传感器呢？如果坠机了就是一个负面强化学习，如果能稳定在空中就给一个正面的强化学习，并通过这种方式来训练系统，并最终成功控制无人机。

吴恩达的无人直升机团队

吴恩达的例子说明什么？ 他最初想纯手工打造一套飞控系统，但是失败了，而使用强化学习、数据分析的方法获得了成功。 我也有类似的经历，只不过我们的对象不是无人机。

我创立的上一家公司为机器学习开发芯片，后来被Analog Devices收购。我们当初做的就是为芯片设计算法，比如用于自动驾驶、雷达、智能手表、医疗传感器、语音识别等。 与吴恩达的无人机飞控系统很相似，都属于单一任务流程。

我们最初在建立模型方面也遇到了很大的问题， 但我们没有选择吴恩达所用的深度学习的路径， 而是把建立模型当做一个工程问题来解决：通过概率编程来测试。

你知道，在上世纪七八十年代，优秀的程序员非常难找，除了深厚的专业知识背景，还要很懂客户和市场。否则要做成一个软件项目非常不容易。

但你看看现在，随便一个大学毕业生，扔给他一套Python训练一周就可以编程了。 我们在过去35年建立起了很多的软件工具，大大降低了像编程这种原本专业性非常强的工作门槛。

问：没错，这就是比尔·盖茨当年提出的将编程技术商品化的概念，让所有人都可以进入这个行业。但史蒂夫·乔布斯就不这么认为，他觉得技术还多样化，而不是作为一种标准商品。你认为，目前AI领域也存在这个问题么？

答：我们可能并没准备好将机器学习“民主化”，当然，这也包括Gamalon专注的概率编程，这些都还是处于非常早期的技术。 但我们的结论是：开发工具还是很必要的。

Gamalon的概率编程如何通过人类笔迹来生成一个标准三角形

吴恩达无法手工编码来设计一套飞控系统，并不是因为手工编码做不到，而是缺乏相应的开发工具来建立飞行控制的概率编程模型。 换而言之，如果有这么一套开发工具，或者吴恩达就不需要使用深度学习了。

总得来说，在某些场景下，比如仅仅是输入输出、传感器与校准等，这些类似于动物反应的情况下，深度学习是一个非常好的选择。但如果 AI 系统涉及到要有自己的“想法”或“判断”，深度学习就不怎么样了。

问：Gamalon技术的优势在哪？接受DARPA的投资是否有考虑过军用技术与商用技术的界定？

答：大部分初创公司都是以现有商用技术为基础，在上面去做用户体验，我的上一家公司也是一样。而现在Gamalon则不同， 我们的优势在于独特的技术赋予我们独特的市场地位， 哪怕最接近的竞争对手也无法做出与我们类似的东西，我们再产品差异化方面做得很好。

更重要的是，我们是第一家将这一技术商业化的公司。目前，据我们所知道的， 全球在这方面做研究的有七个团队，大多在大学和研究机构， 但只有我们是唯一的一家把这项技术变成商业化应用。

不利的地方在于风险非常大，我们必须开发全新的技术，还要让它可以进入应用端。 毕竟，我们不是拿现有技术做改进。

关于与 DARPA 的合作，他们会将所投资的项目进行分级，据我所知， DARPA根据保密级别分为1-10级，每一个级别又会再做细分，他们称之为“技术成熟度”（Technology Readiness Level, TRL）。

比如，DARPA 将 Gamalon 划为 6 级，这里面又分为6.1（大学实验室级别）、6.2（工业科研级别与原型机）、6.3（可小范围部署），以此类推。

目前， Gamalon就是处于6.1级，有点类似于最早期的互联网，不对外开放，但也不保密， 旨在帮助美国国防部看清未来技术发展趋势。

问：目前的深度学习需要大量的数据以及计算资源，这会耗费大量财力物力。但有说法是AI最终将从云端走向本地设备端，Gamalon目前就可以基于像iPad这样的设备，这是否代表你也认同这一趋势？

答：非常好的问题。我们与 Google TensorFlow 以及 TensorFlow Mobile 的团队聊过此事。他们相信， 做深度学习的训练需要大量的计算资源，云端训练是最好的选择，但会在移动端做识别。

简单说， 就是在移动端收集数据→发送到云端→在云端训练神经网络→将训练完成的神经网络下发到移动端→移动端成功识别。 毕竟，识别所需的计算资源要比训练所需的计算资源少成百上千倍。

所以说， DARPA的“第二次技术浪潮”中定义的深度学习是结构化的，训练和学习是中心化的，继而传感器得以随之部署。 这是必要的，因为需要云端去做的训练肯定无法在移动端完成。

DARPA将AI定义为三次浪潮：人工输入的知识库、深度学习为代表的训练模式、自主从数据中获取知识结构

DARPA还定义了“第三次技术浪潮”，虽然这类定义听起来很炫酷，但也确实有一个技术解释： 高等机器学习概率编程（Probabilistic Programming for Advanced Machine Learning, PPMAL），Gamalon就属于这一类。 这类技术在结构上与深度学习不同， 要解决的是无法连接云端情况下，或者说因为安全或隐私问题而不能接入云端时的技术解决方案。

概率编程这项技术不同于深度学习，不需要大量数据和计算资源，往本地化和移动端的方向发展是其自然趋势。但反过来看，即便是在目前深度学习占主导地位的情况下， 概率编程也能反过来帮助深度学习提高效率。 这意味着在同等数据和计算资源的条件下，能完成更多的任务、节约成本。

通过几幅简单的台灯示意图让机器学会识别不同形状的台灯

问：既然你认为机器学习的未来发展是去中心化、向移动端发展，那目前Gamalon有没有来自移动领域的合作伙伴？

答：目前还没有，不过你这倒真是个好主意，我们会认真考虑。真的，或许是时候跟移动产业建立一些伙伴关系了。