本文属于本次Emtech Digital人工智能峰会独家精选。
Gamalon是最近大火的一家从事机器学习相关研究的初创公司,他们的核心技术Bayesian Program Synthesis(BPS)实现了让机器自主完成概率编程,而不再需要人工编写。技术公布后,甚至有媒体宣称机器学习的速度将可能提升百倍。
让机器自行完成概率编程
也正因如此,美国国防部高级计划研究局(DARPA)于不久前对Gamalon注资720万美元,这笔投资是DARPA近年来投入金额最大的案例之一,而且 Gamalon 的技术也被DARPA归为“第三次AI浪潮”。
美国当地时间 3 月 28 日,Gamalon创始人兼首席执行官Ben Vigoda在《麻省理工科技评论》于旧金山举办的Emtech Digital数字峰会上做了专场演讲,DT君随即也对Ben Vigoda做了独家专访。
Ben Vigoda麻省理工科技评论EmTech Digital数字峰会上做演讲
这家被认为“可能会为AI发展带来颠覆式新方法”的公司到底有何独特之处?请见以下专访全文:
问:今天上午的演讲非常精彩,观众们对Gamalon研究人工智能的方式也非常有兴趣。你们所使用的“概率编程”(Probabilistic Programing)与目前基于大数据的深度学习方法非常不同,甚至可以说是基于“小数据”,在设定目标后,由机器去自主学习,会和强化学习有类似之处么?
答:其实和强化学习不太一样,杨立昆(Yann LeCun)有一个关于机器学习三种类型的精彩演讲。他认为,机器学习就像一个蛋糕,上面点缀的浆果就是强化学习,非常美味,但是数量很少。
有点类似于你赢得或输掉了一个游戏,会有很强的体验感,但并不是经常发生。然后,蛋糕上的糖霜可以看做是监督学习。比如,在游戏中得分或死亡,这要比直接输掉或赢得游戏更常发生。
Yann LeCun的“机器学习蛋糕”
最后就是蛋糕本身了,我们称之为无监督学习,这类是最多的。我们没有关于这些数据的反馈,也没人会为我们解释这些数据。比如,你通过机器学习来识别猫,首先得准备大量猫、狗的图片,但并没有人告诉你哪些是猫、哪些是狗,这就是无监督学习。
但即便是在无监督的情况下,有些机器学习系统还是能分辨出猫和狗。毕竟,猫都长得差不多,狗也长得差不多,而且猫和狗看起来不一样。
问:你是如何想到将“概率编程”应用于人工智能研究的?毕竟目前绝大多数的方法都趋于同质化。
答:非常好的问题!我个人的观点是,人工智能的研究目前确实有同质化的问题。目前最主流的方法,比如大家都在做的深度学习:分析海量的数据、调用大量的计算能力。但如果大家都押宝在一种人工智能上,这对其发展是不利的。原因是,AI目前所处的阶段还太早,根本无法判断那种方法会最终胜出。在这个时候去推崇某一技术明显是有问题的。
Ben Vigoda 正在接受 DT 君专访
AI领域同样需要生态多样性。某种程度上,Gamalon其实得益于目前在深度学习领域的大量投资,因为人们只会去关心一件事:你能用深度学习做什么?我们反倒有了自己的发展空间。于是,我们获得美国国防部高级研究计划局(DARPA)的投资。
回到你的问题,为什么我们会尝试一条完全不同的 AI 研究路径?举例而言,吴恩达曾经想设计一套无人机飞控系统,他在编码时考虑到了流体动力学、空气动力学、机械工程等诸多问题,但这套飞控系统还是无法正常工作。
有一天,他突然说,为啥不直接用传感器呢?如果坠机了就是一个负面强化学习,如果能稳定在空中就给一个正面的强化学习,并通过这种方式来训练系统,并最终成功控制无人机。
吴恩达的无人直升机团队
吴恩达的例子说明什么?他最初想纯手工打造一套飞控系统,但是失败了,而使用强化学习、数据分析的方法获得了成功。我也有类似的经历,只不过我们的对象不是无人机。
我创立的上一家公司为机器学习开发芯片,后来被Analog Devices收购。我们当初做的就是为芯片设计算法,比如用于自动驾驶、雷达、智能手表、医疗传感器、语音识别等。与吴恩达的无人机飞控系统很相似,都属于单一任务流程。
我们最初在建立模型方面也遇到了很大的问题,但我们没有选择吴恩达所用的深度学习的路径,而是把建立模型当做一个工程问题来解决:通过概率编程来测试。
你知道,在上世纪七八十年代,优秀的程序员非常难找,除了深厚的专业知识背景,还要很懂客户和市场。否则要做成一个软件项目非常不容易。
但你看看现在,随便一个大学毕业生,扔给他一套Python训练一周就可以编程了。我们在过去35年建立起了很多的软件工具,大大降低了像编程这种原本专业性非常强的工作门槛。
问:没错,这就是比尔·盖茨当年提出的将编程技术商品化的概念,让所有人都可以进入这个行业。但史蒂夫·乔布斯就不这么认为,他觉得技术还多样化,而不是作为一种标准商品。你认为,目前AI领域也存在这个问题么?
答:我们可能并没准备好将机器学习“民主化”,当然,这也包括Gamalon专注的概率编程,这些都还是处于非常早期的技术。但我们的结论是:开发工具还是很必要的。
Gamalon的概率编程如何通过人类笔迹来生成一个标准三角形
吴恩达无法手工编码来设计一套飞控系统,并不是因为手工编码做不到,而是缺乏相应的开发工具来建立飞行控制的概率编程模型。换而言之,如果有这么一套开发工具,或者吴恩达就不需要使用深度学习了。
总得来说,在某些场景下,比如仅仅是输入输出、传感器与校准等,这些类似于动物反应的情况下,深度学习是一个非常好的选择。但如果 AI 系统涉及到要有自己的“想法”或“判断”,深度学习就不怎么样了。
问:Gamalon技术的优势在哪?接受DARPA的投资是否有考虑过军用技术与商用技术的界定?
答:大部分初创公司都是以现有商用技术为基础,在上面去做用户体验,我的上一家公司也是一样。而现在Gamalon则不同,我们的优势在于独特的技术赋予我们独特的市场地位,哪怕最接近的竞争对手也无法做出与我们类似的东西,我们再产品差异化方面做得很好。
更重要的是,我们是第一家将这一技术商业化的公司。目前,据我们所知道的,全球在这方面做研究的有七个团队,大多在大学和研究机构,但只有我们是唯一的一家把这项技术变成商业化应用。
不利的地方在于风险非常大,我们必须开发全新的技术,还要让它可以进入应用端。毕竟,我们不是拿现有技术做改进。
关于与 DARPA 的合作,他们会将所投资的项目进行分级,据我所知,DARPA根据保密级别分为1-10级,每一个级别又会再做细分,他们称之为“技术成熟度”(Technology Readiness Level, TRL)。
比如,DARPA 将 Gamalon 划为 6 级,这里面又分为6.1(大学实验室级别)、6.2(工业科研级别与原型机)、6.3(可小范围部署),以此类推。
目前,Gamalon就是处于6.1级,有点类似于最早期的互联网,不对外开放,但也不保密,旨在帮助美国国防部看清未来技术发展趋势。
问:目前的深度学习需要大量的数据以及计算资源,这会耗费大量财力物力。但有说法是AI最终将从云端走向本地设备端,Gamalon目前就可以基于像iPad这样的设备,这是否代表你也认同这一趋势?
答:非常好的问题。我们与 Google TensorFlow 以及 TensorFlow Mobile 的团队聊过此事。他们相信,做深度学习的训练需要大量的计算资源,云端训练是最好的选择,但会在移动端做识别。
简单说,就是在移动端收集数据→发送到云端→在云端训练神经网络→将训练完成的神经网络下发到移动端→移动端成功识别。毕竟,识别所需的计算资源要比训练所需的计算资源少成百上千倍。
所以说,DARPA的“第二次技术浪潮”中定义的深度学习是结构化的,训练和学习是中心化的,继而传感器得以随之部署。这是必要的,因为需要云端去做的训练肯定无法在移动端完成。
DARPA将AI定义为三次浪潮:人工输入的知识库、深度学习为代表的训练模式、自主从数据中获取知识结构
DARPA还定义了“第三次技术浪潮”,虽然这类定义听起来很炫酷,但也确实有一个技术解释:高等机器学习概率编程(Probabilistic Programming for Advanced Machine Learning, PPMAL),Gamalon就属于这一类。这类技术在结构上与深度学习不同,要解决的是无法连接云端情况下,或者说因为安全或隐私问题而不能接入云端时的技术解决方案。
概率编程这项技术不同于深度学习,不需要大量数据和计算资源,往本地化和移动端的方向发展是其自然趋势。但反过来看,即便是在目前深度学习占主导地位的情况下,概率编程也能反过来帮助深度学习提高效率。这意味着在同等数据和计算资源的条件下,能完成更多的任务、节约成本。
通过几幅简单的台灯示意图让机器学会识别不同形状的台灯
问:既然你认为机器学习的未来发展是去中心化、向移动端发展,那目前Gamalon有没有来自移动领域的合作伙伴?
答:目前还没有,不过你这倒真是个好主意,我们会认真考虑。真的,或许是时候跟移动产业建立一些伙伴关系了。