专栏名称: InfoQ

有内容的技术社区媒体。

吴恩达：为什么我说人工智能会是划时代的变革？

InfoQ · 公众号 · 科技媒体 · 2017-04-07 08:55

正文

作者｜Andrew Ng

译者｜杨旸

如果说最近的技术圈，有一个名词一直保持着火热的关注度的话，那一定是「人工智能」。如果说以前还在观望AI是不是下一个风口，现在讨论的则是怎样抓住AI的发展机遇了。人工智能永恒的春天已经到来，你准备好了吗？

1 写在前面

本文基于Andrew Ng在斯坦福MSx论坛的演讲（Artificial Intelligence is the New Electricity），经演讲人授权，由InfoQ中文站总结并分享。

2017年2月，前百度首席科学家、Coursera的联合创始人Andrew Ng在斯坦福MSx未来论坛上的一个演讲，吸引了全球的眼球。他认为，人工智能(AI)对未来许多行业带来的变革，如同100多年前，美国“触电”一样——电对制造、运输、农业（尤其是冷藏）、医疗等等带来了划时代的变革。

AI驱动着百度的搜索和广告，调度百度外卖的快递员，选择路线，和预估运送时间。AI正在彻底改变金融工程，对物流的转变进行了一半，医疗和自动驾驶刚开始，而前景巨大。和“电”带来的变革一样，很难想象哪个行业不会被AI改变。

2 监督学习

驱动百亿的市场容量的，基本上属于同一种AI: 监督学习（Supervised learning），即用AI来确定A-->B的映射——输入A和响应B的映射。

用Email作为输入A，判断是否是垃圾邮件是响应B。
用图像作为输入，识别这是一千种物体中的哪种？
从声音A到文字B，从英文到法文，或从文字到声音。

软件可以学习这些输入A到响应B的映射——有很多好的工具来让机器学习。比如50,000小时的音频和对应的文本，就能让机器学到如何从音频内容转化为文本内容。通过大量的电邮数据和区分垃圾的标签，也可以很快地训练出一个垃圾邮件过滤器。

现在的AI还很初级——A到B的映射而已，不过已经推动着很大的市场。百度有很好的算法来预测某用户是否会点击某广告。向受众呈现更相关的广告，能为互联网营销和广告公司带来极大的赚钱机会。这可能是AI最赚钱的应用。

3 在哪些产品里能用到AI？

产品经理常常希望了解AI能实现的，和不能实现的。一个简单的思路是：一般人能在一秒内想出来的事情，现在或很快就可以用AI自动实现。

AI进展最快的领域正是人能做得到的领域。比如自动驾驶。人类能驾驶，所以AI也能驾驶。在医学影像阅片和分析上，人类放射科医生能够阅片，所以AI也很可能在未来几年内做到。

而人类难以做到的事情，比如预测股市变化，AI可能也难。

原因1：人类能做的，至少是可行的；

原因2：可以利用人类的数据作为培训样本，比如前面提到的输入A和响应B；

原因3：人类能提供指导。如果AI对某个放射影像的结论有误，设计者可以向医生请教，医生所做的正确结论的原因是什么？进而对AI进行改善。

在Andrew Ng所接触到的80-90%的AI项目中，都遵循这一规律：在人类能做到的领域，AI的进展更快。很多项目的发展一旦超越人类水准，发展也会变得缓慢。这也带来一个社会矛盾： 如果AI和人的水平类似，实质上是跟人类竞争。

4 AI的发展趋势

AI已经出现了几十年了，而近五年发展明显加速，为什么？

当以前的机器学习算法性能上升到一定程度，即使再增加数据样本量（前文谈到的输入A、响应B的A-B映射），性能改善也很有限。似乎超过一定样本量之后，再多的数据也对算法不起作用。

而过去几年，主要由于GPU，我们终于实现了能利用这么巨大的数据集的机器学习软件。将数据输入一个小的神经网络，当超过一定性能后，上升变得平缓。而不断地把数据输入一个很大的神经网络时，即使性能上升没有那么快，也会保持上升趋势，随着数据量的增大，不断提高。

因此，要想获得很好的AI性能，需要两样东西：

很大的A-B映射的数据集；
大的神经网络。现在常用的大型神经网络建立在HPC高性能计算集群上。

现在的大型AI团队包括机器学习和高性能计算两组人，才能获得足够计算能力。百度AI团队里的这两种人员都专注于各自领域，没有人能两者兼备。

5 什么是神经网络？有没可能取代人类大脑？

问题是，我们不清楚人脑如何工作，所以很难造出取代人类大脑的神经网络。

什么是神经网络？先看个最简单的神经网络：

如果想输入房屋面积，得到房屋总价，可以用面积-总价的一阶近似的线性模型来描述这个神经网络。

或者用更多因素建模，比如通过面积和卧室数，从第一个神经元得到可以支持的家庭人数。再通过所在地址的邮编和社区富裕程度，从第二个神经元得到附近学校的质量。

这就成为一个神经网络。面积、卧室数、邮编、社区富裕程度属于“输入”集合A，总价属于“响应”集合B。

好处在于，当训练这样一个神经网络时，用户无需关心中间因素，诸如家庭人数、安全度、学校质量等，也无需关心每个神经元如何将输入映射到中间结果。只需要给出输入集合A和响应集合B，神经网络将自动形成中间的计算过程和参数。当A和B的集合足够大，神经网络可以自动算出很多东西。神经网络看上去非常简单，让很多初学者觉得有点失望，但它确实能解决很多问题。关键在于数据量要够大——几万或几十万个样本本身能提供大量的信息，而软件本身只是一小部分。

6 如何保护AI业务？

AI研究较前沿的团队都比较开放，常常发布研究成果。百度的AI研究论文也没有隐藏什么成果——在人脸识别等论文里，都分享了所有的细节。既然很难把算法本身隐藏起来，如何保护AI业务？当前稀缺资源有两种，一种是数据，二是人才。获取巨量数据很难，要包括输入A+响应B。比如语音识别用了5万小时的音频来训练，今年准备用10万小时，相当于百度10年积累的音频。

以人脸识别所用的训练图像数量为例，

学术上最常用的基准测试/比赛：1百万幅；
所用图像数最多的计算机视觉对象识别学术论文：1500万幅；
百度用来训练世界上最先进的人脸识别系统：两亿幅！

如果只是5-10人的研发团队，很难获得这样规模的数据。百度这样的大企业的经常推出一些新产品不一定是为了营收，而是为了数据，然后通过后续的产品来获得收益。

另一个稀缺资源是人才。AI的应用需要根据具体业务场景来定制。仅仅下载个开源包，无法解决问题。实际情况下，是否适合用某种垃圾邮件识别或语音识别技术？针对某种场景，机器学习怎么用？所以各个公司都在为数据挖掘争夺AI人才，来定制AI技术，找到所需要的A和B各自代表什么，怎么找到这些数据和如何调整算法来适应业务场景。

AI的良性循环

先做出某种产品。比如通过语音识别，以语音实现搜索；
然后吸引来很多用户，用户产生数据；
再通过机器学习，用数据改善产品。

这就形成了AI产品的良性循环。最好的产品能获得最多的用户，带来最多的数据，通过现代机器学习体系，能得到最好的AI，最终让产品变得更好，周而复始。

百度发布新的产品，会特别考虑怎样推动这样的良性循环，会包括相当先进的产品发布策略，比如按地理区域、细分市场等，来更好地推动这个循环。

这种良性循环的理念很早就有了，只是最近变得更加明显。正如前文所述，当数据超过一定规模后，传统AI算法无法明显改善AI性能，因此数据多的优势不明显，大公司也很难保护自己的AI业务。现在数据越多，AI性能越好，大公司也更容易保护自己的优势。

AI炒作的非良性循环

许多人担心AI会不会取代或威胁人类。有一小部分研究AI的人专门从事对“邪恶AI”的炒作，以获得投资人或政府机构的投资，来研究“反邪恶AI”。道高一尺，魔高一丈，又进一步推动对“邪恶AI”的炒作，从而形成非良性循环，非常不健康。

担心AI变得邪恶，类似于担心火星的未来人口过剩。现在看不出AI将会怎样走偏，因此也谈不上有针对地研究相应措施。研究本身没有问题，不同的研究是好事，但是对邪恶AI的研究占用不恰当的资源，就不应该了。两个人，或者10个人来研究邪恶AI也许没问题，但是现在投资得太多。

AI对就业的影响

AI对就业带来的影响更让人担心。有些AI项目确实是瞄准了某些人类岗位，而从事这些工作的人并不清楚严重性。硅谷创造了大量财富，但也应该对其造成的问题承担责任，比如造成的失业问题。AI取代人类岗位的现实问题，更应该引起重视，而不是被邪恶AI的炒作转移了注意力。

7 AI产品管理

AI是个让人兴奋的领域，同时也存在一些挑战。如何将AI融入公司业务？

产品经理的职责是找到用户喜欢的，而工程师的角色是做出可行的产品。两者共同协作，才能做出理想的产品。

AI是个新生事物，所以技术公司以前的流程和工作方法，不太适用。硅谷的产品经理和工程师的合作已有一套标准流程。比如开发APP时，产品经理先画出线框图，比如logo, 按钮，各个板块等，工程师再写出代码来实现。但是AI的APP无法通过画线框来描述。通过什么形式，把产品经理头脑里对AI产品的功能要求明白地分享给工程师呢？

比如开发语音识别系统，实现语音搜索，有很多改善方向。比如：

在嘈杂环境下如何改善,比如车里或咖啡馆?
仅改善窄带语音信号；
对不同口音改善；

百度发现，产品经理通过数据和工程师沟通，是个较好的办法。产品经理负责提供测试数据集给工程师，比如一万个音频和对应的文字，来说明所关心的问题，工程师也能更明白需要解决的问题。如果这些音频里有大量车辆噪音，工程师就知道车辆噪音是问题。如果是混合了几种不同噪声，工程师也能想办法解决。最糟糕的情况是，产品经理提供的测试数据，并不能代表自己想解决的问题，那就出问题了。

同时，新产品设计的流程有很多，比如想设计一个交流型AI机器人：

人：“我想叫个外卖”；
AI：“你喜欢哪种类型餐馆？”；

吴恩达：为什么我说人工智能会是划时代的变革？

正文

请到「今天看啥」查看全文