5 月 25 日晚,刚刚宣布加入 Citadel 的前微软人工智能首席科学家、IEEE Fellow 邓力参加了由中国科大百人会和阿尔法公社联合主办的人工智能产业机会研讨会。
邓力携手另外两位 IEEE Fellow:中国科学技术大学信息科学技术学院执行院长吴枫和科通芯城集团及硬蛋科技的 CTO 李世鹏,与十多位不同行业的创业者、技术人员促膝而谈,回答了他们关于人工智能领域,尤其是关于人工智能技术如何在不同行业得到应用的一系列问题,机器之心对此做了梳理与总结。
Q:近年来,人工智能在哪些领域取得了重大进展呢?对现在和未来几年的业界有哪些直接影响?
邓力(以下简称邓):我认为最大的突破是深度学习被引进人工智能领域。它推动了几个垂直领域世界范围内行业惯用方法的变更,分别是语音识别、图像识别和机器翻译。还有一些领域有突破的迹象,比如销售的数据和自然语言的数据做结合。下一步可能会有更多领域,如健康、金融,进入快速发展阶段。金融领域发展速度很快有两个原因,一是数据充足,二是目标清楚。有一点像 AlphaGo,输赢一目了然,而且可以自己对抗。
李世鹏(以下简称李):在应用层面,人工智能应用在了许多意想不到的领域,获得了不俗的成果。比如在农村金融和畜牧业领域,通过给猪植入芯片,让它成为抵押物,信贷机构能够获得第一手信息,以此为依据发放贷款和销售保险,解决了农村信贷难以量化的问题。
Q:邓力博士,您为什么从科技行业转向金融行业?
邓:因为金融行业机会比较多。在硅谷十七年,人工智能哪些领域可以做哪些领域不可以,基本都知道。同时在现有职位感觉自己的成长已经基本饱和,想进入一些更大的领域进行探索。本来健康领域也一直在我的考虑范围内,但由于隐私问题,数据私有化现象十分严重,尤其在美国,项目如何落地、如何盈利,还有很多未解决的问题。金融领域行业数据相对公开,比较容易成功。
Q:在金融领域已经有很多机构尝试应用了人工智能,比如 Bridgewater,比如 Renaissance。在不同的机构里,人工智能发挥的作用相同吗?
邓:不清楚。因为金融领域不像科技领域那么开放。科技领域的开放、开源,会带来整个平台的提高,从而创造价值。而金融领域的对抗性更强,一旦对手学会了你的方法,你的方法就没有用了。而且科技领域即使方法相同,对手没有数据也无法复制你的成功,金融领域的数据则相对公开。
Q:在 Citadel 这样的机构里,交易员和人工智能科学家的工作有什么区别?
邓:我其实不了解交易员的工作,但人工智能科学家的工作逻辑会和 AlphaGo 做围棋有点像。围棋如此大的一个搜索空间,人工智能仍然能获得很大成功,其根本原因是规则确定,且自行对抗的时候输赢作为输出也一目了然。金融领域的问题也类似,结果一目了然,唯一的区别在于围棋的规则确定性更强,金融则更为复杂,除了两方博弈,还要考虑多个状态间的互相关联。
Q:传感器让我们获得了关于世界的大量数据,在此基础上,人工智能能带来多大的加成?
邓:严格定义里,机器学习有两种。一种是如今的深度学习,给定输入输出后,中间复杂的关系不再需要人撰写规则进行特征提取。它的好处是可以用非常基础的模型把过去需要大量背景知识来建立复杂模型的工作自动完成,局限性是解释性有限。另一种老的基于规则的机器学习方法则能够给出解释性,结果不是很好,但是出了问题后知道如何改正。我认为将来的发展方向是,将新方法和老方法结合在一起,取长补短。结合得比较好的话会有一些不一样的成果。
Q:我们是一家做人体动作捕捉的公司,传统做法是借由陀螺仪、加速度、电磁等传感器,测量骨骼并对人的动作并进行建模。然而由于测量精度已经基本达到传感器的极限、传感器成本无法再大幅度下降等问题,导致动作捕捉技术的应用场景非常有限。请问深度学习能否对强烈依靠测量的动作捕捉领域有所改进呢?能否让我们可以用更少的、更简单的传感器来增强移动性和实时性呢?
邓:近期的深度学习有一个新的概念叫 GAN(生成对抗网络)有可能帮你们解决这个问题。现在它主要还是在图像生成领域,如果你能将它扩展到动态领域那可能对你的工作比较有帮助。GAN 和之前模型的主要区别在于,之前模型直接从数据进行生成,很难保证它和真正的图像没有区别,GAN 的基本思想是,让生成出来的图像(或视频、自然语言)即使和训练数据放在一起,也看不出区别。它的实现原理是建立两个神经网络,一个叫生成器,一个叫鉴别器。鉴别器负责判别一幅图像究竟是真的图像还是由生成器生成出来的。两个模型同时训练,最后期望达到的效果是鉴别器分不出来图像的真假,这时候的生成器,给定一个随机变量,就能够生成一个和原来数据没什么区别的数据。
吴枫:在可行性方面,我的答案是肯定的。你的工作是将传感器输入变成关节参数,这和机器人行走领域很像。2015 年开始有人工智能方法进入机器人行走领域。以前的机器人一定要传感器的反馈,然后进行判断、做出动作。但是很多特殊的行为是来不及等传感器数据的,数据处理完了,机器人已经失去重心摔倒了。因此研究人员用神经网络,在只有少量信息(比如传感器被遮挡得非常厉害)的时候,对未知信息做出估计和预测,进而做出决策。这是神经网络完全可以做的。在实时性方面,这个挑战很大,主要受到计算能力的制约。实际上在人工智能的发展中,计算资源是主要的一个制约因素,如果有好的计算能力,很多方法都可以投入应用。现在很多人在做神经芯片,比 TPU 对矩阵的加速还要更进一步,用高密集度,比如百万个核,用仿生结构实现高效率低能耗的计算。
(左起)邓力、吴枫、阿尔法公社创始人许四清、诺亦腾 CTO 戴若犁及李世鹏就深度学习在动作捕捉领域应用的可能性进行讨论
更多有关GMIS 2017大会的内容,请点击「阅读原文」查看机器之心官网 GMIS 专题↓↓↓