本文属于本次Emtech Digital人工智能峰会独家精选。
Gamalon是最近大火的一家从事机器学习相关研究的初创公司,他们的核心技术Bayesian Program Synthesis(BPS)实现了让机器自主完成概率编程,而不再需要人工编写。技术公布后,甚至有媒体宣称机器学习的速度将可能提升百倍。
让机器自行完成概率编程
也正因如此,美国国防部高级计划研究局(DARPA)于不久前对Gamalon注资720万美元,
这笔投资是DARPA近年来投入金额最大的案例之一,
而且 Gamalon 的技术也被DARPA归为“第三次AI浪潮”。
美国当地时间 3 月 28 日,Gamalon创始人兼首席执行官Ben Vigoda在《麻省理工科技评论》于旧金山举办的Emtech Digital数字峰会上做了专场演讲,
DT君随即也对Ben
Vigoda
做了独家专访。
Ben Vigoda麻省理工科技评论EmTech Digital数字峰会上做演讲
这家被认为“可能会为AI发展带来颠覆式新方法”的公司到底有何独特之处?请见以下专访全文:
问:今天上午的演讲非常精彩,观众们对Gamalon研究人工智能的方式也非常有兴趣。你们所使用的“概率编程”(Probabilistic Programing)与目前基于大数据的深度学习方法非常不同,甚至可以说是基于“小数据”,在设定目标后,由机器去自主学习,会和强化学习有类似之处么?
答:其实和强化学习不太一样,杨立昆(Yann LeCun)有一个关于机器学习三种类型的精彩演讲。他认为,
机器学习就像一个蛋糕,上面点缀的浆果就是强化学习,非常美味,但是数量很少。
有点类似于你赢得或输掉了一个游戏,会有很强的体验感,但并不是经常发生。
然后,蛋糕上的糖霜可以看做是监督学习。
比如,在游戏中得分或死亡,这要比直接输掉或赢得游戏更常发生。
Yann LeCun的“机器学习蛋糕”
最后就是蛋糕本身了,我们称之为无监督学习,这类是最多的。
我们没有关于这些数据的反馈,也没人会为我们解释这些数据。比如,你通过机器学习来识别猫,首先得准备大量猫、狗的图片,
但并没有人告诉你哪些是猫、哪些是狗,这就是无监督学习。
但即便是在无监督的情况下,有些机器学习系统还是能分辨出猫和狗。
毕竟,猫都长得差不多,狗也长得差不多,而且猫和狗看起来不一样。
问:你是如何想到将“概率编程”应用于人工智能研究的?毕竟目前绝大多数的方法都趋于同质化。
答:非常好的问题!我个人的观点是,
人工智能的研究目前确实有同质化的问题。
目前最主流的方法,比如大家都在做的深度学习:分析海量的数据、调用大量的计算能力。
但如果大家都押宝在一种人工智能上,这对其发展是不利的。
原因是,
AI目前所处的阶段还太早,根本无法判断那种方法会最终胜出。
在这个时候去推崇某一技术明显是有问题的。
Ben Vigoda 正在接受 DT 君专访
AI领域同样需要生态多样性。
某种程度上
,
Gamalon其实得益于目前在深度学习领域的大量投资,因为人们只会去关心一件事:
你能用深度学习做什么?
我们反倒有了自己的发展空间。
于是,我们获得美国国防部高级研究计划局(DARPA)的投资。
回到你的问题,
为什么我们会尝试一条完全不同的 AI 研究路径?
举例而言,吴恩达曾经想设计一套无人机飞控系统,他在编码时考虑到了流体动力学、空气动力学、机械工程等诸多问题,
但这套飞控系统还是无法正常工作。
有一天,他突然说,为啥不直接用传感器呢?如果坠机了就是一个负面强化学习,如果能稳定在空中就给一个正面的强化学习,并通过这种方式来训练系统,并最终成功控制无人机。
吴恩达的无人直升机团队
吴恩达的例子说明什么?
他最初想纯手工打造一套飞控系统,但是失败了,而使用强化学习、数据分析的方法获得了成功。
我也有类似的经历,只不过我们的对象不是无人机。
我创立的上一家公司为机器学习开发芯片,后来被Analog Devices收购。我们当初做的就是为芯片设计算法,比如用于自动驾驶、雷达、智能手表、医疗传感器、语音识别等。
与吴恩达的无人机飞控系统很相似,都属于单一任务流程。
我们最初在建立模型方面也遇到了很大的问题,
但我们没有选择吴恩达所用的深度学习的路径,
而是把建立模型当做一个工程问题来解决:通过概率编程来测试。
你知道,在上世纪七八十年代,优秀的程序员非常难找,除了深厚的专业知识背景,还要很懂客户和市场。否则要做成一个软件项目非常不容易。
但你看看现在,随便一个大学毕业生,扔给他一套Python训练一周就可以编程了。
我们在过去35年建立起了很多的软件工具,
大大降低了像编程这种原本专业性非常强的工作门槛。
问:没错,这就是比尔·盖茨当年提出的将编程技术商品化的概念,让所有人都可以进入这个行业。但史蒂夫·乔布斯就不这么认为,他觉得技术还多样化,而不是作为一种标准商品。你认为,目前AI领域也存在这个问题么?
答:我们可能并没准备好将机器学习“民主化”,当然,这也包括Gamalon专注的概率编程,这些都还是处于非常早期的技术。
但我们的结论是:开发工具还是很必要的。
Gamalon的概率编程如何通过人类笔迹来生成一个标准三角形
吴恩达无法手工编码来设计一套飞控系统,并不是因为手工编码做不到,而是缺乏相应的开发工具来建立飞行控制的概率编程模型。
换而言之,如果有这么一套开发工具,或者吴恩达就不需要使用深度学习了。
总得来说,在某些场景下,比如仅仅是输入输出、传感器与校准等,这些类似于动物反应的情况下,深度学习是一个非常好的选择。但如果 AI 系统涉及到要有自己的“想法”或“判断”,深度学习就不怎么样了。
问:Gamalon技术的优势在哪?接受DARPA的投资是否有考虑过军用技术与商用技术的界定?
答:大部分初创公司都是以现有商用技术为基础,在上面去做用户体验,我的上一家公司也是一样。而现在Gamalon则不同,
我们的优势在于独特的技术赋予我们独特的市场地位,
哪怕最接近的竞争对手也无法做出与我们类似的东西,我们再产品差异化方面做得很好。
更重要的是,我们是第一家将这一技术商业化的公司。目前,据我们所知道的,
全球在这方面做研究的有七个团队,大多在大学和研究机构,
但只有我们是唯一的一家把这项技术变成商业化应用。
不利的地方在于风险非常大,我们必须开发全新的技术,还要让它可以进入应用端。
毕竟,我们不是拿现有技术做改进。
关于与 DARPA 的合作,他们会将所投资的项目进行分级,据我所知,
DARPA根据保密级别分为1-10级,每一个级别又会再做细分,他们称之为“技术成熟度”(Technology Readiness Level, TRL)。
比如,DARPA 将 Gamalon 划为 6 级,这里面又分为6.1(大学实验室级别)、6.2(工业科研级别与原型机)、6.3(可小范围部署),以此类推。
目前,
Gamalon就是处于6.1级,有点类似于最早期的互联网,不对外开放,但也不保密,
旨在帮助美国国防部看清未来技术发展趋势。
问:目前的深度学习需要大量的数据以及计算资源,这会耗费大量财力物力。但有说法是AI最终将从云端走向本地设备端,Gamalon目前就可以基于像iPad这样的设备,这是否代表你也认同这一趋势?