专栏名称: 产业智能官
用新一代技术+商业操作系统(AI-CPS OS:云计算+大数据+物联网+区块链+人工智能),在场景中构建状态感知-实时分析-自主决策-精准执行-学习提升的认知计算和机器智能;实现产业转型升级、DT驱动业务、价值创新创造的产业互联生态链。
目录
相关文章推荐
北京厚朴中医  ·  今晚19:00直播 | 筑基课程说明与探究 (下) ·  2 天前  
拾榴询财  ·  新一轮户型革命来了!还有这么炸裂的房子 ·  4 天前  
北京厚朴中医  ·  厚朴电子日历 | 早 ·  4 天前  
51好读  ›  专栏  ›  产业智能官

【深度学习】这才是深度学习的本源

产业智能官  · 公众号  ·  · 2019-08-11 04:54

正文



内容来源: 2019年7月26日,在长城 会主办的“GMIC之院士AI论坛”上,索尔克生物研究所计算神经生物学实验室主任特伦斯进行了以“ 人工智能 将成科技的最大风口 ”为主题的精彩分享。 笔记侠作为合作方,未经主办方和讲者审核。


讲者 | 特伦斯

封面设计 & 责编 | 马畅

3960 篇深度好文:6003 字 | 12 分钟阅读

完整笔记·人工智能


本文优质度:★★ 口感:红烧狮子头


笔记君邀您阅读前,先思考:


  • 人工智能是为了实现什么?

  • 什么是真正的深度学习?


一、人工智能与人的大脑


大家好。 现在人工智能对科学发展起着推波助澜的作用,如虎添翼,我们今天讨论的话题,就是这样普适的内容。

我们先回顾一下过去的250年。 英国的工业革命兴起后,蒸汽机的发明增强了人类使用动能的能力,一个蒸汽机就能取代一百个劳动力。

当时,世界上的大部分人口,仍在农场进行手工劳动,可这样一来,手工劳动都被蒸汽机取代了。 蒸汽机极大程度地替代了人工劳动力。

工业革命也带来人口迁移,人们从乡村转移到城镇。 工业革命为社会带来极深远的影响。

从过去的250年可以看到,一系列的工业革命,使科学技术大范围地使用,各种技术层出不穷,这些技术深刻影响我们生活的方方面面。

当然这也有不少缺陷。 几十年来,比如说工业革命时期的伦敦,有着大量的雾霾、烟尘,这是因为使用了以煤为驱动的蒸汽机所导致的。

在煤厂工作的煤炭工也饱受着呼吸疾病折磨,这是技术带来便利的同时,也要面临的挑战。 怎么进行空气治理,减少呼吸疾病,就是一大挑战。

技术发展的同时,也需要处理技术带来的后果。 我们现在正面临的人工智能技术也不例外。

▲ 长按图片分享给需要的人


大家会听到很多科技热词,我来简单介绍一下:

人工智能。 这个名词诞生于1956年,目标就是在机器上模仿人类智能。 这是一个非常大的目标,我们至今仍然没有达到这个目标。

在人工智能范畴内,有一个子范畴快速增长,就是机器学习。 机器学习是以另一种方向发展人工智能。

比如说你能编程,就说明你已经具备了这个领域的知识,能去解决相关问题,而且解决问题的形式就是编程。 所以你能编程,就已经是这个领域的专家。


但机器学习的路径是不一样的。 我们通过收集大量数据、通过机器进行学习,利用数据结构化进行学习,学习图像对象、语言、词语序列等等。

在机器学习范畴,又另有一个方法学,就是特定算法。这是受到大脑启发触动的一个方向。

我们的大脑是一个非常复杂的设备,负责收集信息,有数千亿的脑神经元,来进行信息传递。

比如在场这么多人,大脑通过上千亿脑神经元进行信息处理,再将信息传递给在座各位。


目前我们仍然不了解大脑的内部运作,但是我想说,深度学习的灵感就来自大脑运作机制。


▲ 学习与编程的权衡

红线是编程线,如果要雇一个程序员给你解决问题,这个成本从1980年到2040年,成本都是逐年增加的。 编程员是很贵的,而且需要专家级的编程员。

所以相对来说,从发展开始,我们的机器学习,从上世纪80年代开始,成本就非常高,电脑非常贵。 但是现在的人工智能、机器学习,成本不断下降。

2012年,机器学习算法跟编程的成本大致相同,从2012年开始就逐年下降。

我们使用不同的数据组,不需要完全了解这个领域的知识,只要获得大量实例数据,我们的机器就可以通过特定的学习算法不断解决困难。

我们使用神经网络处理系统,在30年前就提出“神经网络模式”的理论。 脑神经网络可以有效处理复杂的数据组,也有能力处理上亿的图像数据。

我相信在座各位对于阿尔法狗与柯洁的大战是非常熟悉的。 2017年阿尔法狗打败世界围棋冠军柯洁,当时震惊世界。

不仅是因为它通过围棋这么复杂的运动,而打败了世界围棋冠军,同时还有巨大的人类共鸣,认为: 机器打败人类,已经超越人类了。

在阿尔法狗打败世界冠军前,人们认为机器可以学得很好,但是不可能打败人类。 但我们来看看柯洁是怎么说的:

“去年跟阿尔法狗对话,觉得它的下棋方式非常接近人类,今天已经像围棋之神一样在下棋,它每一步下棋的章法非常创新,是之前棋盘没有出现过的,非常创新,如果是人,我们称之为围棋天才。 因为是通过人工智能,阿尔法狗出现创新下棋之举,所以也可以看到通过AI机器学习,机器也可以实现超神一般的创新。



人类的大脑机制,是一个非常简单的版本,大脑里有很多神经元,大概上千亿个,但它们是平行工作的,这和数字化电脑不一样。

电脑是有处理器的,是有内存的。 记忆实际上是神经元之间的连接,也就是在突触中存在,十的十次方个神经元,就有十个十次方个连接。

大脑里突触的数量非常多,也就是说大脑内存是巨大的,可以储存非常多的数据,这是大脑的好处。 问题是人脑是毫秒级传输速度,所以和电脑比慢很多。

在自然中,人脑没有这么多处理层,而且电脑计算速度更快,是因为我们居住的世界就是毫秒级的世界,不需要这么快的速度。

我们在大脑中的信息传递,是非常复杂的过程。 信息的储存、处理等等,都是我们要解决的一大串问题,这才是最关键的。

还有一些挑战,比如说有很多神经元、有突触等等,最终是围绕着中枢神经系统,这是最重要的一个器官。

我们要知道,某一个连接的改变是否会改变信息的输入和输出? 如果把这个连接改变了,就会受到影响。


当时杰弗里和我一起,得出神经算法,也就是怎么样才能让突触处理正确的神经传递。

在这之前,几乎所有的科学家和工程师觉得这是不可能的。 但我想告诉一些年轻人:

你不要相信专家说的话,因为很多专家总是知道这个事情不能做的原因,但是不知道这个事情可以做成的方法。

所以我们发明了玻尔兹曼机,今天在网络神经学习中还在使用。


二、什么是真正的深度学习?


深度学习网络是怎样的? 举个例子: 一边是输出,是要对疾病进行诊断,另一边是各种各样的输入,对于医生来说,看了就可以得出诊断。

每一个信息点就是神经节点,最希望有一个架构师能让这些信息一层层传递到输出端,可以有效地诊断这是什么疾病。

帮助病人治病,我们需要大量的病历输入才可以做到这一点,而且必须从已经确诊的病人那里获得信息,这才是有效的输入。

机器不是说要去记住这些东西,将其泛化,因为不同人给出的输入不一样,人脑可以进行非常好的泛化,这是我们希望让机器做到的事情。

杨立昆是一个架构师,而且受到了视觉系统的启发,大概在上世纪60、70年代的时候,已经有一些生物学家学习了人的视觉系统。 所以我们知道在人脑当中,信息是如何流动的。

他们研究了猴子的架构,因为人与猴子有一定的相似性。 他们就是设计并用了卷积神经网络的算法,这边输入信息,将图像和神经元网络进行结合,传输后进行输出。



这里有猴子的大脑,有一层层的神经输入架构,最上面的是猴子的大脑皮层最上端,一、二、三层等等输入,要怎么样大脑才能解决视觉输入的方法?



杨立昆他们设计多层架构,使用早期的卷积神经网络,最终他们就有了识别物体的功能。

还有就是网络中的单元,模仿人的大脑,而且有阈值,如果低于这个阈值就没有输出,高于这个阈值才有。

之后他们还进行了一系列的实验,进行了很多技术上的工作。


这是2012年的时候,ImageNet比赛,这是一个深度学习应用。 这个网络里有概率分布,第一张图,大家最高概率猜的是老鼠,我可能也猜不出是虫,以为是蜘蛛。

后面也是猜图片,不同人看到的是不同面。 我们看出,在性能级别上,深度学习能够在计算机识别方面,把误差率下降20%,这已经非常厉害了。

而且这是经过很多年才有的成果,但是对于某一些图像依然无法准确识别。 关键是要不断进行改善、演化。

今年图灵奖颁给我的朋友杨立昆、约书亚·本吉奥、杰弗里·辛顿,这相当于诺贝尔级别了,是对他们在深度学习里非常大的鼓励。

而且深度学习现在成了很热的词。 去年我写了一本书,总结深度学习的发展历史:


深度学习是怎么来的、学习算法是怎么来的、取得了哪些成功、有哪些失败、未来将向何处去、偏差带来哪些问题、怎么解决、未来的挑战等等。 最近这本书已被翻译成中文。


我书中的一个章节写到: 皮肤病医生看病,检查病人的病到底是癌症还是良性的,已经治疗了2000例皮肤病的医生收集的数据,用来做训练集。

机器和16个皮肤病学家同场竞技,人们发现网络表现和医生是并驾齐驱的,诊断 率可以达到92%之高。

只要有一台手机,只要看到有一块皮肤病就可以拍照,马上可以得到诊断,不需要去看医生,也不需要去付很多医药费。
有谁去看过皮肤病的? 去医院看皮肤病真的很麻烦,有时候要做出诊断,需要好几个星期,甚至几个月时间,这样往往让病人苦不堪言。
书是2017年写的,2018年出版,今天我在听一个电台节目时,听到有一个公司,已经提供了这样的服务:
只要病患拍照发到他们平台,他们的AI系统就可以告诉病人,现在是否要就医,还是说是良性的。
有一位女士,看到她男朋友背上长了一些东西,就随便拍了照片试一下,发给这个平台,谁料到竟然是恶性的,因为及时就诊,她救了自己男朋友一命,而且收费才29美元。



这是WAYMO自动驾驶汽车,舆论让你感觉明天就可以做成,其实要做几十年时间,因为有很多路况和复杂因素需要攻克和优化。

这辆汽车搭载了很多雷达和传感器,180度的传感器不像我们人类的视觉,只能看前方,它可以有180度的视角。

现在无人驾驶汽车的应用场景非常受限,我们看一下有可能的一些场景——

如果我们能一键启车,就可以提高车辆使用率,如果无人驾驶汽车能够实现这单,就可以重新规划停车场和停车道。

因为大量汽车利用率增高,很多车都在路上跑,就不需要那么多停车场了,我们现在城市里遍布的停车场、停车道,都可以再利用,可以变成公园、自行车专道。
当然,这样很多公司可能就要关门大吉了,就是汽车维修店和汽车保险公司。 但是更重要的,这样可以挽救很多生命:
因为疲劳驾驶是导致事故死亡的重要原因,酒驾、醉驾的事件也很多,每年在高速公路,醉驾导致4万人死亡。
一键启车最大的便利是可以节省通行时间,尤其是出行高峰的时候,高峰时候堵车是很堵心的,如果我们使用无人驾驶汽车,就都不用开车了。
出行时间可以用来看看报纸,驾驶完全自动且安全,这样可以极大的降低交通事故死亡率。


我们还可以更进一步畅想,盗车时代会被终结; 此外还有一些新的就业岗位生成,很多人说卡车司机要失业了,不会的,我们如果使用无人驾驶的卡车,也要人去控制的。

卡车司机的角色可以转化为安全监测,这个岗位比开卡车好得多,而且更舒服。

现在无人驾驶汽车仍然不能实现,因为有很多极端路况交通控制,比如说卡车有一些货物掉在路上怎么办?
所以我们还吸收更多的训练数据,集训无人卡车,一旦有这种边缘情况案例出现,我们需要有人监控。
机器是监控不了的,所以我们仍然需要人去监控这些无人驾驶的卡车。
这还这能催生另一个新的产业岗位,传感器技术供应链。 这是一个全新的供应链。
因为我们需要在无人驾驶车辆上边搭载几十亿个传感器,大量数据生成后,我们需要进行数据清理,这些都会催生很多很好的新工作岗位。
这一个公司——睿金科技——来自中国郏县,他们是有几千万人专门做数据清理的公司。
听上去是挺烦燥的工作,但是比在“煤矿”上工作更好,其实是数据挖煤,这比在现实中的煤矿挖煤好得多。


接下来举一个语言翻译的例子。 语言翻译在中国有几千个语种,互相不能理解,所以我们训练机器预计下一个字词出现,这时候不需要分类数据,是非监督学习。

这种叫做文字嵌入。 如果机器能够训练得很好,我们期望的是学习内模通过自己的活动运算,可以了解和解构整个语义,同时要识别出大写的专有名词,非常有趣。

比如说俄罗斯和莫斯科是一组对应关系,这是一个项量,将这个项量依附于德国,则德国对应柏林。 这个网络没有任何监督,就可以发现城市首都的关系和地理位置的关系。






请到「今天看啥」查看全文