专栏名称: 腾讯科技

只供应最有营养的科技大餐！

机器也能自主编程了，这家大火的AI初创公司是怎么做到的？

腾讯科技 · 公众号 · 科技媒体 · 2017-03-31 06:56

正文

请到「今天看啥」查看全文

点击上方“ 腾讯科技 ”，选择“置顶公众号”

关键时刻，第一时间送达！

文 / DeepTech深科技

本文属于本次Emtech Digital人工智能峰会独家精选。

Gamalon是最近大火的一家从事机器学习相关研究的初创公司，他们的核心技术Bayesian Program Synthesis（BPS）实现了让机器自主完成概率编程，而不再需要人工编写。技术公布后，甚至有媒体宣称机器学习的速度将可能提升百倍。

让机器自行完成概率编程

也正因如此，美国国防部高级计划研究局（DARPA）于不久前对Gamalon注资720万美元，这笔投资是DARPA近年来投入金额最大的案例之一，而且 Gamalon 的技术也被DARPA归为“第三次AI浪潮”。

美国当地时间 3 月 28 日，Gamalon创始人兼首席执行官Ben Vigoda在《麻省理工科技评论》于旧金山举办的Emtech Digital数字峰会上做了专场演讲，DT君随即也对Ben Vigoda做了独家专访。

Ben Vigoda麻省理工科技评论EmTech Digital数字峰会上做演讲

这家被认为“可能会为AI发展带来颠覆式新方法”的公司到底有何独特之处？请见以下专访全文：

问：今天上午的演讲非常精彩，观众们对Gamalon研究人工智能的方式也非常有兴趣。你们所使用的“概率编程”（Probabilistic Programing）与目前基于大数据的深度学习方法非常不同，甚至可以说是基于“小数据”，在设定目标后，由机器去自主学习，会和强化学习有类似之处么？

答：其实和强化学习不太一样，杨立昆（Yann LeCun）有一个关于机器学习三种类型的精彩演讲。他认为，机器学习就像一个蛋糕，上面点缀的浆果就是强化学习，非常美味，但是数量很少。

有点类似于你赢得或输掉了一个游戏，会有很强的体验感，但并不是经常发生。然后，蛋糕上的糖霜可以看做是监督学习。比如，在游戏中得分或死亡，这要比直接输掉或赢得游戏更常发生。

Yann LeCun的“机器学习蛋糕”

最后就是蛋糕本身了，我们称之为无监督学习，这类是最多的。我们没有关于这些数据的反馈，也没人会为我们解释这些数据。比如，你通过机器学习来识别猫，首先得准备大量猫、狗的图片，但并没有人告诉你哪些是猫、哪些是狗，这就是无监督学习。

但即便是在无监督的情况下，有些机器学习系统还是能分辨出猫和狗。毕竟，猫都长得差不多，狗也长得差不多，而且猫和狗看起来不一样。

问：你是如何想到将“概率编程”应用于人工智能研究的？毕竟目前绝大多数的方法都趋于同质化。

答：非常好的问题！我个人的观点是，人工智能的研究目前确实有同质化的问题。目前最主流的方法，比如大家都在做的深度学习：分析海量的数据、调用大量的计算能力。但如果大家都押宝在一种人工智能上，这对其发展是不利的。原因是，AI目前所处的阶段还太早，根本无法判断那种方法会最终胜出。在这个时候去推崇某一技术明显是有问题的。

Ben Vigoda 正在接受 DT 君专访

AI领域同样需要生态多样性。某种程度上，Gamalon其实得益于目前在深度学习领域的大量投资，因为人们只会去关心一件事：你能用深度学习做什么？我们反倒有了自己的发展空间。于是，我们获得美国国防部高级研究计划局（DARPA）的投资。

回到你的问题，为什么我们会尝试一条完全不同的 AI 研究路径？举例而言，吴恩达曾经想设计一套无人机飞控系统，他在编码时考虑到了流体动力学、空气动力学、机械工程等诸多问题，但这套飞控系统还是无法正常工作。

有一天，他突然说，为啥不直接用传感器呢？如果坠机了就是一个负面强化学习，如果能稳定在空中就给一个正面的强化学习，并通过这种方式来训练系统，并最终成功控制无人机。

吴恩达的无人直升机团队

吴恩达的例子说明什么？他最初想纯手工打造一套飞控系统，但是失败了，而使用强化学习、数据分析的方法获得了成功。我也有类似的经历，只不过我们的对象不是无人机。

我创立的上一家公司为机器学习开发芯片，后来被Analog Devices收购。我们当初做的就是为芯片设计算法，比如用于自动驾驶、雷达、智能手表、医疗传感器、语音识别等。与吴恩达的无人机飞控系统很相似，都属于单一任务流程。

我们最初在建立模型方面也遇到了很大的问题，但我们没有选择吴恩达所用的深度学习的路径，而是把建立模型当做一个工程问题来解决：通过概率编程来测试。

你知道，在上世纪七八十年代，优秀的程序员非常难找，除了深厚的专业知识背景，还要很懂客户和市场。否则要做成一个软件项目非常不容易。

但你看看现在，随便一个大学毕业生，扔给他一套Python训练一周就可以编程了。我们在过去35年建立起了很多的软件工具，大大降低了像编程这种原本专业性非常强的工作门槛。

问：没错，这就是比尔·盖茨当年提出的将编程技术商品化的概念，让所有人都可以进入这个行业。但史蒂夫·乔布斯就不这么认为，他觉得技术还多样化，而不是作为一种标准商品。你认为，目前AI领域也存在这个问题么？

答：我们可能并没准备好将机器学习“民主化”，当然，这也包括Gamalon专注的概率编程，这些都还是处于非常早期的技术。但我们的结论是：开发工具还是很必要的。

Gamalon的概率编程如何通过人类笔迹来生成一个标准三角形

吴恩达无法手工编码来设计一套飞控系统，并不是因为手工编码做不到，而是缺乏相应的开发工具来建立飞行控制的概率编程模型。换而言之，如果有这么一套开发工具，或者吴恩达就不需要使用深度学习了。

总得来说，在某些场景下，比如仅仅是输入输出、传感器与校准等，这些类似于动物反应的情况下，深度学习是一个非常好的选择。但如果 AI 系统涉及到要有自己的“想法”或“判断”，深度学习就不怎么样了。

问：Gamalon技术的优势在哪？接受DARPA的投资是否有考虑过军用技术与商用技术的界定？

答：大部分初创公司都是以现有商用技术为基础，在上面去做用户体验，我的上一家公司也是一样。而现在Gamalon则不同，我们的优势在于独特的技术赋予我们独特的市场地位，哪怕最接近的竞争对手也无法做出与我们类似的东西，我们再产品差异化方面做得很好。

更重要的是，我们是第一家将这一技术商业化的公司。目前，据我们所知道的，全球在这方面做研究的有七个团队，大多在大学和研究机构，但只有我们是唯一的一家把这项技术变成商业化应用。

不利的地方在于风险非常大，我们必须开发全新的技术，还要让它可以进入应用端。毕竟，我们不是拿现有技术做改进。

关于与 DARPA 的合作，他们会将所投资的项目进行分级，据我所知，DARPA根据保密级别分为1-10级，每一个级别又会再做细分，他们称之为“技术成熟度”（Technology Readiness Level, TRL）。

比如，DARPA 将 Gamalon 划为 6 级，这里面又分为6.1（大学实验室级别）、6.2（工业科研级别与原型机）、6.3（可小范围部署），以此类推。

目前，Gamalon就是处于6.1级，有点类似于最早期的互联网，不对外开放，但也不保密，旨在帮助美国国防部看清未来技术发展趋势。

问：目前的深度学习需要大量的数据以及计算资源，这会耗费大量财力物力。但有说法是AI最终将从云端走向本地设备端，Gamalon目前就可以基于像iPad这样的设备，这是否代表你也认同这一趋势？

答：非常好的问题。我们与 Google TensorFlow 以及 TensorFlow Mobile 的团队聊过此事。他们相信，做深度学习的训练需要大量的计算资源，云端训练是最好的选择，但会在移动端做识别。

简单说，就是在移动端收集数据→发送到云端→在云端训练神经网络→将训练完成的神经网络下发到移动端→移动端成功识别。毕竟，识别所需的计算资源要比训练所需的计算资源少成百上千倍。

所以说，DARPA的“第二次技术浪潮”中定义的深度学习是结构化的，训练和学习是中心化的，继而传感器得以随之部署。这是必要的，因为需要云端去做的训练肯定无法在移动端完成。

DARPA将AI定义为三次浪潮：人工输入的知识库、深度学习为代表的训练模式、自主从数据中获取知识结构

DARPA还定义了“第三次技术浪潮”，虽然这类定义听起来很炫酷，但也确实有一个技术解释：高等机器学习概率编程（Probabilistic Programming for Advanced Machine Learning, PPMAL），Gamalon就属于这一类。这类技术在结构上与深度学习不同，要解决的是无法连接云端情况下，或者说因为安全或隐私问题而不能接入云端时的技术解决方案。

概率编程这项技术不同于深度学习，不需要大量数据和计算资源，往本地化和移动端的方向发展是其自然趋势。但反过来看，即便是在目前深度学习占主导地位的情况下，概率编程也能反过来帮助深度学习提高效率。这意味着在同等数据和计算资源的条件下，能完成更多的任务、节约成本。

通过几幅简单的台灯示意图让机器学会识别不同形状的台灯

问：既然你认为机器学习的未来发展是去中心化、向移动端发展，那目前Gamalon有没有来自移动领域的合作伙伴？

答：目前还没有，不过你这倒真是个好主意，我们会认真考虑。真的，或许是时候跟移动产业建立一些伙伴关系了。