250多年来,经济增长的根本动力一直是技术创新。其中最重要的是经济学家所谓的通用技术——包括蒸汽机、电力和内燃机。每一个都催化了互补创新和机遇的浪潮。例如,内燃机汽车、卡车、飞机、链锯和割草机,以及大型零售商、购物中心、交叉码头仓库、新供应链等。像沃尔玛Walmart、UPS和Uber等公司都找到了利用技术来创造可赢利的新业务模式的方法。
我们这个时代最重要的通用技术是人工智能(AI),尤其是机器学习(ML)——也就是说,机器有能力不断提高性能,而无需人工解释如何完成它所提供的所有任务。在过去的几年里,机器学习变得更加有效和广泛。我们现在可以构建学习如何自己执行任务的系统。
为什么这是一件大事呢?有两个原因。
首先,人类知晓的事物比我们能表述出来的要多得多:我们无法确切地解释我们如何能够做很多事情。在应用机器学习的方法之前,由于这方面的缺陷意味着我们无法使很多任务自动化。现在我们可以了。
其次,机器学习系统通常是优秀的学习者。他们可以在广泛的活动中实现超人的表现,包括检测欺诈和诊断疾病。这类优秀的数字学习者正在被部署到整个经济中,他们的影响将是深远的。
在商业领域,AI将对早期通用技术的规模产生革命性的影响。尽管它已经在世界各地数千家公司中使用,但还有大量的机会还在等待被发掘。随着制造业、零售业、交通、金融、医疗、法律、广告、保险、娱乐、教育、以及几乎所有其他行业都正在利用机器学习技术来转变其核心流程和商业模式,AI的影响将在未来十年被放大。现在的瓶颈在于管理、实施和业务畅象。
然而,与其他许多新技术一样,人们对AI也产生了许多不切实际的期望。我们看到很多创业公司的BP中开始加入很多关于机器学习、神经网络和其他形式的技术,虽然这和实际功能没有什么联系。例如,把一个约会网站包装成AI在背后支持的并不会让它变得更有效,但在融资上却可能会有很大帮助。本文希望抛开围绕在AI周围的噪声,来向大家展示AI的真正潜力、它的实际意义,以及AI实际应用中的障碍。
今天AI可以做什么?
AI这个词是在1955年由达特茅斯大学的数学教授John McCarthy提出的,他在次年组织了这个主题的开创性会议。从那以后,或许是由于这个令人回味名字的原因,这个领域的发展远远超过了人们的想象。1957年,经济学家 Herbert Simon 预言计算机将在10年内击败人类(实际上花了40年)。1967年,认知科学家Marvin Minsky说,“在一代人的时间内,人工智能的问题将得到极大的解决。” Simon和Minsky都是智力巨人,但显然他们都错了。
我们先来看看AI已经在做什么,以及这个领域的进展有多快。最大的进展来自于两大领域:感知(perception)和认知(cognition)。在前一类中,最前沿的进展大部分是和语音相关的。语音识别还没有达到完美,但现在有数百万人已经在使用它们了——想想Siri、Alexa和Google Assistant。你现在正在阅读的这篇文章最初是由我们口述给计算机的,已经比我们自己打字更快了。斯坦福大学计算机科学家James Landay和他的同事进行的一项研究发现,语音识别的速度大约是手机上打字速度的三倍。语音识别的错误率已经从过去的8.5%,下降到4.9%了。令人惊讶的是,这种实质性的进步并非在过去10年,而是从2016年夏天开始。
图像识别领域的进展也让人惊叹。你可能已经注意到,Facebook和其他app现在已经能从你上传的图片中识别出你的朋友,并提示你用他们的名字来标记他们。在你的智能手机上运行的app可以识别任何野生鸟类。图像识别甚至取代了公司门禁卡。自动驾驶汽车中所使用的视觉系统,在识别一个行人的时候,通常会在30帧中出现一次错误(在这些系统中,相机记录大约每秒30帧);而现在,它们的错误频率要少于1千万帧。ImageNet这个大型数据库中识别图像的错误率,已经从2010年的30%下降到了2016年的4%。
近年来,随着大规模深度神经网络的使用,AI领域的进展日新月异。当然,目前基于机器学习的视觉系统还远远没有完美无缺——但即使是人也不是无所不能的嘛。
AI领域第二类的主要进步是集中在认知和问题解决方向。机器已经打败了最优秀的(人类)扑克玩家和围棋选手——虽然原来专家们预测至少还要再过十年。谷歌的DeepMind团队使用了机器学习系统来提高数据中心的冷却效率提升了15%。像Paypal这样注重网络安全的公司也正在用AI来检测恶意软件。由IBM技术支撑的系统使得新加坡一家保险公司的索赔过程进入了自动化。数十家公司正在使用机器学习来帮助进行金融交易决策,而且越来越多的信贷决定是在AI帮助下做出的。亚马逊采用机器学习来优化库存,并提升给客户的产品推荐。Infinite Analytics公司开发了一个机器学习系统来预测用户是否会点击某个特定的广告,为一家全球消费包装产品公司的在线广告位置进行了优化。另一个开发的系统帮助巴西的一家在线零售商改进客户的搜索和发现过程。第一个系统将广告的ROI提升了三倍,而第二个系统使得年收入增加了1.25亿美元。
机器学习系统不仅在许多应用中取代了旧有的算法,而且在许多曾经被人类做得最好的任务上也占尽先机。尽管这些系统并不完美,但它们的错误率已经表现比人类更好了。语音识别,即使在嘈杂的环境中,现在也几乎等同于人类的表现。这为改变人们的工作和经济带来了巨大的新可能性。一旦基于AI的系统在给定的任务中超过人类的表现,它们就更有可能迅速传播。例如,Aptonomy和Sanbot,这两家分别是无人机和机器人的制造商,他们正在使用改进的视觉系统来自动化大部分保安人员的工作。软件公司Affectiva使用它们来识别诸如快乐、惊讶和焦点小组的愤怒等情绪。Enlitic是几家利用AI来识别医疗影像,进而帮助诊断癌症的深度学习的初创公司之一。
这些成果都令人印象深刻,但是基于AI的系统的适用性仍然相当狭窄。例如,既然AI在拥有数百万图片的ImageNet数据库上表现出色,也并不总能在现实环境中取得同样的成功。因为在现实世界里,光线条件、角度、图像分辨率和背景可能会非常不同。更重要的是,如果人类完成了一项任务,我们会很自然地假设此人在相关任务中具有一定的能力。但是,机器学习系统是被训练来完成特定的任务,因此通常他们的知识不会泛化。我们离那些能在不同领域展现通用智力的机器还非常遥远。
理解机器学习
要理解机器学习,最重要的一点是它代表了一种从根本上与以往不同的创建软件的方法:机器从示例中学习,而不是明确地为特定的结果编程。这是一个重大突破。在过去50年的大部分时间里,信息技术的进步和它的应用都集中在编纂现有的知识和程序,并将它们嵌入到机器中。实际上,术语“coding”表示将知识从开发人员的头脑中转移到机器能够理解和执行的形式的艰苦过程。这种方法有一个根本的问题:我们所有的知识都是隐性的,这意味着我们无法完全解释它。我们几乎不可能写出能让另一个人学会骑自行车或认出朋友脸的指令。
换句话说,我们知道的比我们能讲出来的东西要多。这个事实非常重要,它被称为:Polanyi悖论。Polanyi悖论不仅限制了我们能告诉别人的东西,而且对我们赋予机器智能的能力是一个根本性的限制。很长一段时间,这限制了机器在经济中能够有效发挥作用的活动。
机器学习正在克服这些限制。在第二个机器时代的第二次浪潮中,由人类制造的机器正在从例子中学习,并利用结构化的反馈来解决他们自己的问题,如Polanyi经典的识别人脸的问题。
机器学习的不同风格
人工智能和机器学习有许多种方式,但近年来的大多数成功都是在一个类别:监督学习系统。在这里,机器被给予了很多正确答案的例子。这个过程几乎总是涉及从一组输入X,到一组输出Y的映射。例如,输入可能是各种动物的图片,正确的输出可能是这些动物的标签:狗,猫,马。输入也可以是声音录音的波形,输出可以是文字:“是的”,“不”,“你好”,“再见”。
成功的系统通常使用一组数据的训练集,有成千上万甚至上百万个例子,每一个都被贴上正确的答案。然后,可以放任系统去看新的示例。如果训练进行得很好,系统将会以很高的准确度来预测答案。
推动这种成功的算法依赖于一种叫做深度学习的方法,这种方法使用神经网络。深度学习算法比早期的机器学习算法有很大的优势:它们可以更好地利用更大的数据集。随着训练数据中的示例数量的增加,旧系统将会得到改进,但这只是在一定程度上,在此之后,额外的数据不会带来更好的预测。根据AI巨头之一的Andrew Ng,深度神经网络似乎并没有达到这样的水平:更多的数据会带来更好的预测。一些非常大的系统通过使用3600万个例子或更多。当然,处理非常大的数据集需要越来越多的处理能力,这是非常大的系统经常在超级计算机或专门的计算机架构上运行的原因之一。
不论你是在何种场景下拥有很多关于行为的数据并试图预测结果,都有可能用到监督学习系统。亚马逊负责消费者业务的Jeff Wilke说,监督学习系统基本上取代了用于向客户提供个性化推荐的基于记忆的过滤算法。在其他情况下,建立库存水平和优化供应链的经典算法已经被基于机器学习的更高效和健壮的系统所取代。摩根大通推出了一套审查商业贷款合同的系统,过去以贷款计36万小时的工作现在可以在几秒钟内完成。监督学习系统现在被用于诊断皮肤癌。这些只是一些例子。
给一个数据体贴上标签,用它来训练一个受监督的学习者是相当简单的;这就是为什么监督的机器学习系统比没有监督的系统更常见,至少现在是这样。无人监督的学习系统寻求独立学习。我们人类是优秀的没有监督的学习者:我们掌握了我们对世界的大部分知识(例如如何认识一棵树),很少或没有标记的数据。但是要开发一个成功的机器学习系统是非常困难的。
如果我们有朝一日建立了稳健的无人监督学习机器,将会打开一扇新世界的大门。这些机器可以用新的方式来研究复杂的问题,以帮助我们在自己还没意识到之前,就发现了其中的传播模式,比如疾病的传播,市场上的证券价格变动,顾客的购买行为等。为此,Facebook的人工智能研究主管、纽约大学教授Yann LeCun将监督学习系统生动的比作蛋糕上的糖霜,无监督学习则是蛋糕本身。
在这个领域内另一个小众但发展快速的领域是强化学习(reinforcement learning)。这种方法嵌入到已经掌握了Atari技能的视频游戏和棋类游戏的系统中。它还有助于优化数据中心的电力使用情况,并为股票市场制定交易策略。Kindred使用机器创建的机器人能够识别和分类他们从未遇到过的对象,加快了在配送中心对消费品进行“挑选和放置”的过程。
在强化学习系统中,程序员指定系统的当前状态和目标,列出允许的操作,并描述约束每个动作的结果的环境元素。使用允许的操作,系统必须弄清楚如何尽可能接近目标。当人类能够明确目标但却不知道如何达到目标时,这些系统就能正常工作。例如,微软利用强化学习,通过“奖励”这个系统来为MSN.com的新闻故事选择标题,当更多的访问者点击链接时,这个系统会得到更高的分数。该系统试图根据设计者给出的规则来最大化其分数。当然,这意味着一个强化学习系统将对你明确奖励的目标进行优化,但这也有可能并不是你真正关心的目标(如终身客户价值),因此正确明确目标和明确的目标是至关重要的。
让机器学习工作起来
对于希望将机器学习尽快应用起来的公司来说,有三个好消息。首先,人工智能技术正在迅速蔓延。世界上仍然没有足够的数据科学家和机器学习专家,但是对他们的需求正在被在线教育资源和大学所满足。其中最好的,包括Udacity、Coursera和fast.ai。人工智能已经不仅仅是一个书上的概念,已经可以让聪明的、有潜力的学生们达到能够创建工业级的机器学习算法部署的目的。除了培训自己的员工之外,感兴趣的公司还可以使用在线人才平台,如Upwork、Topcoder和Kaggle,来寻找具有可验证的专业知识的机器学习专家。
第二个可喜的发展是,现代人工智能的必要算法和硬件可以根据需要购买或租用。谷歌、亚马逊、微软、Salesforce和其他公司正在通过云计算提供强大的机器学习基础设施。这些竞争对手之间的激烈竞争意味着,那些想尝试或部署机器学习算法的公司将会看到越来越多的功能随着时间的推移而不断降价。
最后一个甚至仍有可能被低估的好消息是,有效使用机器学习算法所需要的数据可能没有你想象的那么多。大多数机器学习系统的性能提高,因为它们有更多的数据。所以拥有的数据越多,胜出的可能越大,这在逻辑上是行得通的。如果“赢”的意思是“在全球市场上主导某一应用领域,例如广告定位或语音识别”,那确实没毛病。但如果将“成功”定义为显著提高性能,那么获得足够的数据其实是非常容易的。
例如,Udacity联合创始人Sebastian Thrun注意到,他的一些销售人员在回答聊天室的入站问题时,比其他人更有效。Thrun和他的研究生Zayd Enam意识到他们的聊天室日志实际上是一组标记的训练数据——这正是监督学习系统需要的。导致销售的交互作用被标记为成功,所有其他的都被标记为失败。Zayd利用这些数据来预测成功销售人员在回答一些非常常见的问题时可能给出的答案,然后与其他销售人员分享这些预测,以推动他们更好的表现。经过1000次的培训,销售人员的工作效率提高了54%,并且一次能服务两倍的顾客。
AI初创公司WorkFusion采用了类似的方法。它与其他公司合作,将更高的自动化水平引入后台流程,例如支付国际发票和在金融机构之间进行大型交易。这些过程还没有自动化的原因是它们很复杂,相关的信息并不总是每次都以同样的方式呈现——我们怎么知道他们在说什么货币,并且有必要进行一些解释和判断。WorkFusion的软件在人们工作时观察他们的一举一动,并将其作为训练数据用于分类的认知任务:“这张发票是美元的,这个是日元。这是欧元……一旦系统对其分类有足够的信心,它就会接管整个过程。
机器学习在三个层次上驱动变化:工作任务和职位、业务流程和业务模型。工作和职业被重塑的一个例子是使用机器视觉系统来识别潜在的癌症细胞——释放放射科医生以专注于真正的关键病例,与病人沟通,和与其他医生协调。影响业务流程的一个例子是,在引入机器人和基于机器学习的优化算法之后,重新设计了Amazon实现中心的工作流和布局。类似地,业务模型需要再优化,以利用可以智能化地推荐音乐或电影的机器学习系统。与其在消费者选择的基础上销售歌曲,一个更好的模式可能会为一个个性化的电台提供订阅服务,这样可以预测并播放特定顾客喜欢的音乐,即使这个人以前从未听过。
但要注意的是,机器学习系统是无法完全代替这个职位、流程或业务模型的。大多数情况下,它们是对人类活动的补充,使他们的工作变得更有价值。对于新的劳动分工来说,最有效的规则很少是“把所有的任务交给机器”。相反,如果一个过程的成功完成需要10个步骤,其中一个或两个步骤可能会自动完成,而其余的则会变得更有价值。例如,Udacity的聊天室销售支持系统并没有试图构建一个能够接管所有对话的机器人;相反,它向销售人员提供了如何提高性能的建议。人类仍在掌控中,但变得更加有效和高效。这种方法通常比设计能够完成人类所有操作的机器更可行。它通常会带来更好的、更令人满意的工作,最终为客户带来更好的体验。
设计和实施新的技术、人类技能和资本资产组合,以满足客户的需求需要大规模的创意和计划。这就是一个机器不擅长的任务。这就使得企业家或商务经理成为了社会最具回报价值的工作之一。
风险和局限
第二个机器时代的第二波浪潮带来了新的风险。特别是,机器学习系统通常具有较低的“可解释性”,这意味着人类很难弄清楚系统是如何做出决定的。深层神经网络可能有几亿的连接,每一个都贡献了一点点的最终决定。因此,这些系统的预测往往会抵制简单而清晰的解释。与人类不同,机器还不是很好的故事讲述者。他们不能总是给出一个理由,说明为什么某个特定的申请人被录用或被拒绝了,或者推荐了一种特殊的药物。具有讽刺意味的是,即使我们已经开始克服Polanyi的悖论,我们也面临着另一个版本:机器知道的比它们能告诉我们的更多。
这将带来三个风险。首先,机器可能有隐藏的偏见,不是来自设计者的任何意图,而是来自提供给系统的数据。举个例子,如果一个系统了解到哪些求职者在面试中使用了过去招聘人员所做的一系列决定来接受面试,那么它可能会无意中学会将他们的种族、性别、种族或其他偏见延续下去。此外,这些偏差可能不会作为一个明确的规则出现,而是被考虑到成千上万个因素之间的微妙交互中。
第二个风险是,与传统的基于显式逻辑规则的系统不同,神经网络系统处理的是统计学上的真理,而不是真实的事实。这可能会使证明系统在所有情况下,尤其是在没有在培训数据中表示的情况下工作很难,甚至不可能。缺乏可验证性对于任务型的应用场景是一个问题,例如控制核电站,或者涉及生死抉择。
第三,当机器学习系统确实出现错误时,几乎不可避免地会出现错误诊断和纠正错误。导致解决方案的底层结构可能是难以想象的复杂,如果系统被培训的条件发生变化,那么解决方案可能会远远不够理想。
尽管所有这些风险都是真实的,但适当的标 准不是为了定义完美,而是最好的选择。毕竟,我们人类也有偏见、犯错误,并且很难如实解释我们是如何做出一个特定的决定的。基于机器的系统的优点是,它们可以随着时间的推移得到改进,并在提供相同数据时给出一致的答案。
这是否意味着人工智能和机器学习能做到一切事情?感知和认知涵盖了大量的领域——从驾驶汽车到预测销售,再到决定雇佣谁或提拔谁。我们相信,人工智能在大多数或所有领域的性能将很快达到超人水平。那么什么是AI和ML做不到的呢?
我们有时会听到“人工智能永远不会擅长评估感性、狡诈、善变的人类,它太死板、太没人情味了”等类似的抱怨。但我们不以为然。像Affectiva这样的机器学习系统,在以声音或面部表情为基础来辨别一个人的情绪状态时,已经达到或超越了人类的表现。其他系统可以推断出,即使是世界上最好的扑克玩家也能在令人惊讶的复杂游戏中击败他们。准确地阅读人们是一件很微妙的工作,但这不是魔法。它需要感知和认知——确切地说,现在的机器学习是强大的,并且一直变得更强大。
讨论人工智能的极限可以从毕加索对计算机的观察出发:“但它们是无用的,只能给你答案。”它们当然不是一无是处,正如机器学习最近的胜利所彰显的那样,但毕加索的观察仍然提供了参考。电脑是用来回答问题的装置,而不是用来造问题的。这意味着企业家、创业者、科学家、创造者和更多的人,他们都要想,下一步要解决的问题是什么,或者有什么新领域要探索,这将是至关重要的。
同样,被动地评估一个人的精神状态和积极努力去改变它,两者之间有着巨大的差异。机器学习系统在前者上表现惊人,但后者要想赶超人类需要进步的空间还很大。我们人类是一个非常社会化的物种,我们不是机器,最擅长利用诸如同情、自豪感、团结和羞耻等社会驱动力来说服、激励和感染彼此。2014年,TED大会和XPrize基金会宣布设置一个奖项以期待,“第一个人工智能来到这个舞台,给一段同样富有感染力的TED演讲,让观众起立为其鼓掌”。估计这个奖项很快就要被捧回家了。
我们认为,在这个超级强大的人工智能的新时代里,人类智慧的最大和最重要的机遇在于两个领域的交叉点:找出下一步要解决的问题,并说服许多人去解决问题,并广泛应用。这是对领导力的一个很好的定义,在第二个机器时代,领导力变得更加重要。
在头脑和机器之间划分工作的现状很快就会瓦解。与那些愿意并且能够把机器学习放在适当的地方,并能找出如何有效地将其功能与人类的能力集成起来的竞争对手相比,故步自封的公司将很快发现自己会出去前所未有的劣势和被动中。
商业世界的构造变革时代已经开始,由技术进步带来。就像蒸汽动力和电力一样,它本身也无法获得新技术,甚至无法进入顶尖技术人员,将赢家和输家区分开来。相反,它是那些思想开放的创新者,能够看到过去的现状,并设想出截然不同的方法,并且有足够的悟性把它们放在合适的位置。机器学习的最大遗产之一可能是创造新一代的商业领袖。
在我们看来,人工智能,尤其是机器学习,是我们这个时代最重要的通用技术。这些创新对商业和经济的影响不仅反映在他们的直接贡献上,也体现在他们能够支持和鼓励互补创新的能力上。通过更好的视觉系统、语音识别、智能问题解决以及机器学习带来的许多其他功能,新产品和新工艺正在成为可能。
一些专家甚至走得更远。现在负责丰田研究机构的Gil Pratt将目前的人工智能技术与5亿年前的寒武纪大爆发相比较,那就是诞生了各种各样的新生命形式。就像现在一样,关键的新功能之一就是视觉。当动物第一次获得这种能力时,它允许它们更有效地探索环境;这就催化了物种数量的大量增加,包括捕食者和猎物,以及被填满的生态龛的范围。今天,我们还希望看到各种各样的新产品、服务、流程和组织形式,以及大量的物种灭绝。当然也会有一些骤然失败和意想不到的成功。
虽然很难准确预测哪些公司会在新环境中占据主导地位,但一般原则是明确的:最灵活、适应性强的公司和执行力将会发展壮大。在AI驱动的时代,任何对趋势敏感且能快速反应的团队都更应该抓住这次好机会。因此,成功的策略是愿意尝试并快速学习。如果职业经理人们没有在机器学习领域增加实验,他们就没有在做他们的工作。未来十年,人工智能不会取代管理人员,但使用人工智能的经理将取代那些不使用人工智能的人。