口述 | 王咏刚
整理 | 张晓军 史翔宇
6月24日,人工智能先行者大会暨黑马大赛人工智能分赛在京举行,近千名人工智能产业相关创业者、投资人、产业专家参会。本次活动由创业黑马与人工智能新媒体平台黑智联合主办,联合冠名商摩比神奇与战略合作伙伴铂诺对活动进行了支持。
会上,创新工场AI工程院副院长王咏刚发表题为《创新工场的AI布局》的演讲。在他看来,大众认知的人工智能和实际的人工智能存在着很大区别,人工智能技术在很多方面还等待破局,创新工场在技术研发、培训、投资等多方面在人工智能领域的投入,最终想要做的是,让人工智能成为人类的工具,成为一个即插即用的工具箱。
以下为王咏刚演讲,经创业家&i黑马编辑:
大家好,我是创新工场AI工程院的副院长王咏刚,去年加入创新工场,之前在Google做了10年的工程师。
今天,我想给大家分享的是创新工场在人工智能领域的布局。我们到底怎么看待人工智能现在所处的现状,在面对投资、创业、技术研发等问题时,都会考虑哪些问题?
其实,对于很多不是搞技术、创业或者投资的人,“人工智能”这四个字大概是2016年3月AlphaGo和李世石下棋后,才进入到他们的视野,才知道人工智能原来和自己的生活有关。但他们往往会把人工智能理解成科幻小说中写的人工智能,担心是不是在未来某一天,人工智能能够毁灭人类。
如果我们不去科普,用科学或者符合技术逻辑的方法,让更多的普通人了解什么是人工智能,那无论是在创业还是投资上,都会存在很大的问题。
比如,我在和一些大型集团的业务线老总谈人工智能时,他们经常会问到这样一个问题:“你们现在投了那么多人工智能项目,做图像、声音、无人驾驶、自然语言等方面的创新,这些创新不是在给人类掘墓吗?”他们认为这种新的技术最终会统治人类,垄断资源,甚至让人类走向灭亡。
这确实是一些人对于人工智能非常真实的反应。
创新工场在做技术研发和投资的同时,花了大量精力做相关的科普工作,主要想告诉大家,今天的人工智能科学技术和科幻电影里说的人工智能,基本上是两件事。
如果将我们人类的进化用机器学习来比喻的话,那它也有一个目标函数,但这个目标函数和我们给机器设定的目标函数会非常不一样。因为,人类的进化是大自然在几十亿年时间内,从低等到高等,从简单到复杂,不断进化而来。这个目标函数大致就是保证自己的种族繁衍,同时保证能够尽可能多的占领地球资源。
这和科学家、研究者、工程师,给现代机器、人工智能设定的目标函数,根本不是一回事。我们给人工智能设定的目标函数,往往是你对图像识别的错误率尽可能低,你对人类语言从英语映射到中文的准确率尽可能高,它是这样一种非常具体的,基于任务的目标函数。
正是因为这种本质上的不同,所以我们会说今天所有人工智能的科研、技术、产品和创业,只是人类的工具。如果要说1000年、10000年以后的事情,那我相信这个事情的结局会非常的开放。
怎么看待今天的人工智能技术?这是创新工场对今天人工智能技术发展过程,以及未来可能在哪些领域取得突破,做一个简单的理解。
今天人工智能的发展,是基于深度学习在2006-2010年间取得了一系列的理论突破。现在还在吃这个老本,把它应用到图像、声音、文本,以及所有有大数据的领域中。
但是,今天正在取得成果的很多技术,都可能在不远的将来,真正转化为产品和竞争力。比如增强学习,大家可能已经在AlphaGo中看到了它非常强大的威力。事实上,增强学习在机器人、无人驾驶,以及所有涉及到环境感知的领域都有非常强的应用场景。我们也非常关注增强学习和每一个具体商用领域、具体落地产品的关联。
再比如说迁移学习,今天人工智能在这块的表现非常差,甚至不如一个小孩。当一个小孩开始理解世界,在进入新的领域时,根本不用像现在的计算机那样学几万、几十万、几百万张的图片。他们只要看两三个样本就可以进入到新的领域,只要看一个具体的分析,就可以从中抽象出这个领域某一个对象的特质。
所以,如果我们没有办法在迁移学习上取得突破,也就没有办法让人工智能从已有的知识推广到另一个领域,或者从已有的数据推广到另一种数据。那么,我们就永远被拴在人工智能必须是算法和大数据结合这样一个等式上。
可喜的是,科研界现在有非常多关于迁移学习的新技术和新产品出来,这些技术什么时候能够在创业领域开花结果?我相信大概在几年时间内。
跨领域自然语言理解技术,是我们关注另一个重点方向。几十年来,人工智能界都会把自然语言理解叫做“人工智能皇冠上的明珠”,原因在于自然语言理解是一个远复杂于图像理解、语音理解、大数据理解的非常复杂、完全崭新的领域。
在自然语言理解领域,数据的维度空前高。数据本身的灵活性、信息的灵活性,信息和每一个标注对应关系的复杂度,都远远高于图像和语音领域。在这个领域,我们几乎不敢苛求100%的理解。因为100%理解自然语言、通过图灵测试的计算机,就已经跨入了强人工智能的门槛。接下来的超人工智能、毁灭人类的现象,有可能随之到来。
但是,如果把自然语言理解的精通设定为100分的话,现在可能只做到了5分。从5分到50分,从50分到60分,从60分到80分,这里面有非常多可以扩展的空间和进步的地方。
我个人在Google 10年间做自然语言方面的东西,更倾向于预测在下一步自然语言理解领域,翻译技术有可能取得实质性的突破。去年已经看到Google在翻译技术方面里程碑式的论文。
未来三五年,或者再多一点时间,也许所有的人都不需要再学任何外语,我们到任何的国家都可以用一部手机无缝交流。它可能达不到人类智慧的标准,但是可以处理像翻译、智能助理、客服应答这样基础的任务。
经过三年、五年、八年、十年的发展,我们相信,所有的人工智能前沿技术,会变成一个非常好用、便捷的工具箱。做技术的都知道,现在已经有很多开源的人工智能技术,像Google的TensorFlow,类似这样的框架至少有几十种。
从今天的TensorFlow,GPU、TPU的管理,Docker这样的封装、集成,到未来即插即用、即开即用的人工智能解决方案还有多远?我相信这个距离也不是那么远。
我非常希望看到,在两三年后,到任何一个行业,哪怕不懂人工智能的工程师,都可以快速地接入人工智能技术,用人工智能的工具箱解决这行业领域里的具体问题。这是我们对人工智能技术发展的基本愿望,也就是人工智能成为人类的工具,成为一个即插即用的工具箱。
但是我也非常清楚地认识到,今天很多主讲嘉宾都提到人工智能在创业和投资领域存在泡沫,这种泡沫现象在美国、中国都非常的明显。可以明确的是,人工智能投资和创业有泡沫,但人工智能这件事没有泡沫。
至于今天遇到的这些泡沫,以及人工智能在实际的创业和投资过程中遇到的挑战,创新工场基本的总结是这样的:
首先,人工智能领域太多的创业者都是科学家、工程师,他们离真正使用的行业还很远。现在让一个科学家和银行业务主管,或者保险公司代理员,坐下来讨论关于人工智能的方案规划,还是非常困难的,这是今天人工智能创业最大的特点。因为以往做互联网、移动互联网创业的,很多都是行业专家出身。
第二,人工智能的人才缺口巨大,人才结构失衡。人才是创新工场非常关心的一件事。现在有大量的培训机构宣称可以培训、批量复制人工智能工程师,我也知道那些21天成才的人工智能工程师都学了什么课程。
非常简单,第一周学python,第二周学数学模型,第三周做几个demo跑一遍,他就可以对外宣称自己是一个人工智能工程师,是一个在AI领域可以拿到高薪的工程师。
严格来讲,在人工智能领域,真正能够解决问题、解决业务需求的工程师非常少。这些工程师因为稀缺,所以身价相对高的离谱。这也是很多创业公司很艰难的一个地方。他们可能想与人工智能集成,但雇不到那么多、雇不起这样的人才。创新工场也希望通过培训、暑期训练营,以及开放一些可以帮助科研、帮助学生成长的数据集等方式,来解决这些问题。
第三,数据孤岛化和碎片化现象非常明显。我们现在做数据,一方面很难保证用户隐私。另一方面,很难收集到完整集成的数据。数据几乎成了某些公司的核武器。这些公司可能没有人工智能的力量,但是它有数据,就只能在这个领域掌握先机,甚至形成垄断。
可复用和标准化的技术框架、平台、工具和服务,还需要2-3年才能成熟。一些领域也存在超前发展、盲目投资的问题。加上目前很多人工智能创业是2B端的,所以难度相对较高,早期团队也需要更多支持。
创新工场有一个基本的投资逻辑,它是根据我们对人工智能整个技术和产业发展的基本判断来做的。
今天的人工智能产业的发展,我们判断会经历三个阶段:
阶段一:已经发生的。今天人工智能技术已经在为互联网和移动互联网上这些拥有虚拟数据、虚拟流程的企业大量的“印钞”了。百度、Google这样的搜索引擎公司,Facebook这样的社交网络公司,以及今日头条这样的内容推荐、分发公司,他们的核心竞争力就是人工智能。
人工智能就是用人工智能机器学习出来的规则、算法,帮他们进行内容排序、广告推荐,他们每天赚到的钱里,90%可能都是因为使用了人工智能。所有这些线上的电子商务公司、内容公司,如果不和人工智能结合,就一定会落后。
人工智能在绝大多数虚拟的、线上的,和数据、搜索、内容分发、广告相关领域,已经扎扎实实的落地了。如果还听到有人说人工智能落地很难,你可以告诉他,Google、百度大量的营收都是从人工智能来的。只是今天的人工智能还有一点点局限在虚拟世界里。
从虚拟世界,扩展到同样拥有数据资源、同样在虚拟世界里运营业务的其他领域,仍然存在刚才说的2B端的领域壁垒。比如说同样是算法推荐技术、机器学习技术,用到在线领域可能相对容易一点,用在银行大数据领域,就要熟悉银行的业务;用在金融的量化交易领域,就要熟悉量化交易所需要的交易规则。我们会看到,人工智能必将从互联网、移动互联网领域慢慢向其他业务端移动。移动的指标,只不过在于它是不是具备了完整的大数据流程。
阶段二:会稍晚一些。我们的判断是会花2-3年或者3-5年的时间。这是人工智能从虚拟世界(线上)向现实世界(线下)不断扩展的阶段。比如现在所有做安防的公司,依靠人脸识别、形体识别,从个人身份识别完成安防体验的公司,他们其实已经通过传感器,为线上和线下的沟通构建渠道。
以后这样的传感器会越来越多,把线上的数据和线下的业务场景联系起来,把线下人物实体、事物实体、声音实体转换成数字化线上信息,反馈给线上,形成这样一个闭合流程以后,再各个不同的行业会建立越来越多。
比如我们最近还在聊一个完全线下的、跟仓储和海运相关的项目。我们建议他们在很多地方放不同的传感器,收集这些纯线下的数据和信息。当这些线下的信息汇总到线上之后,我们可以用类似搜索引擎和广告推荐的机器学习算法,来解决他们原本在线下的业务问题。这是我们认为人工智能在产业落地的第二阶段。
阶段三:人工智能在产业落地的这个阶段,就会从全面的线上转向全面的线下,通过不断的发展,让我们生活中的每一个地方都充满人工智能,包括无人驾驶对所有产业的改造。按我们的想法,无人驾驶永远是所有人工智能产业的领头羊。这个领头羊不仅仅解决造汽车和需不需要司机的问题,它应该会像汽车产业那样,彻底的颠覆整个人类的衣食住行等很多方面。
当无人驾驶充满这个城市的时候,城市的交通改造就会是一个非常大的项目。城市智能化的停车,需不需要那么多停车场,城市的共享经济应该怎么构建,甚至城市的人口住在哪里、工作在哪里的重新规划,都会成为非常大的课题,支撑巨大的产业。
今天无人驾驶还停留在L2、L3这样的阶段。很多从事无人驾驶的创业公司还只是盯着产业中间的某个细分环节,例如有的在做感知,有的在做决策、控制,有的专做传感器,甚至有很多公司专门在做高精度的无人驾驶地图。
基于今天的发展,未来必然会进入整合阶段。到了那个阶段,才会产生L4或者L5、真正实现所谓全功能、全天候的无人驾驶技术。
现在展示的这张图,是创新工场根据人工智能三阶段发展的划分来定义,现阶段三到五年,五到十年,在十年后我们的投资重点,我不细讲所有的领域,我只是在讲我们今天可能投资的有金融行业的人工智能、无人驾驶方面人工智能,我们也投资了一些跟教育相关的人工智能。
未来在2-3年、3-5年内,我们会把这样的落地扩展到更多的领域,例如医疗、在线教育领域的人工智能深化,以及具体行业解决方案的人工智能,包括刚才讲的海运业、零售业,甚至包括矿产、物联网里的人工智能。这件事是由时间曲线慢慢推动的,我们不会急于现在什么领域都投,什么方式都参与,而是根据技术发展的客观规律,以及人工智能在不同领域、不同阶段落地的先后关系,做出我们的投资决策。
创新工场的人工智能战略包括两个部分。
第一部分:创新工场这7年一共投资了300多家企业,其中人工智能技术驱动的,或者以人工智能技术为导向的企业有30多家,占投资总数的10%左右,我们会在人工智能投资领域继续布局、继续深入跟进。
第二部分:因为今天人工智能面临的问题,比如科学家创业的难题、人才培养难题,以及人工智能在不同行业落地的难题。我们创立了创新工场人工智能工程院,从Google、微软、Twitter吸引一些真正做人工智能的一线工程技术大牛,第一个目的就是培养人才,我们在学校大量招聘毕业生、实习生。
这个训练营对学生完全免费,会提供教师资源、课程资源、导师资源,包括非常充裕要多少有多少的GPU资源和办公资源。
上个月消息发布后,收到来自全国顶尖高校的600多份申请,最终从中选出30个学生进入训练营。
未来,我们也会面向科研界、学术界,发布专门用于科研的数据集和辅助的科研资源,为科研发展、学术发展投入我们的力量。
与此同时,创新工场人工智能工程院也在积累我们的技术。针对一些前沿的论文,例如强化学习、迁移学习,以及前沿的自然语言处理方面的应用,我们也慢慢把它们转化为可以实际落地的产品技术。为什么叫工程院?就是因为我们在做的是扎扎实实的和工程有关的事情。
所以,未来从这些技术、产品里,也许可以孵化出一些新兴的人工智能创业公司。
简单的讲,创新工场的人工智能工程院的使命,就是培养人才、孵化技术和产品,未来有可能成为一个公司,或者人工智能的孵化器,这是我们对创新工场人工智能工程院的基本定位。
以上就是创新工场在人工智能方面的基本布局,谢谢大家!
* 本文系i黑马(ID:iheima)原创,口述王咏刚,整理张晓军 史翔宇。如需转载请联系微信公众号(ID:iheima)授权,未经授权,转载必究。
—— 黑马五月好文 ——
i黑马,让创业者不再孤独。
商务合作:15801105017(微信)
黑马大赛仍在火热进行中,7月份短视频行业分赛即将上线,欢迎点击报名!