专栏名称: 投行圈
投行圈是您身边垂手可得的互联网投资银行!助您创业、展业、传业;助您创富、聚富、传富!【温馨提示】本系统展示的信息并不保证投资者获得收益。投资有风险,决策须谨慎。
目录
相关文章推荐
投资界  ·  一家E轮独角兽宣布倒闭 ·  5 天前  
阿尔法工场研究院  ·  反腐调整、手游承压,网易又要市值管理了? ·  6 天前  
何夕  ·  傻逼肖钢 傻逼易会满 ... ·  6 天前  
饕餮海投资  ·  今天,被套了! ·  6 天前  
51好读  ›  专栏  ›  投行圈

未来人工智能:从AlphaGo到BeltaGo

投行圈  · 公众号  · 投资  · 2017-03-27 17:31

正文

作者按:2016年,人工智能60周年。1956年夏,麦卡锡、明斯基等正式确立了人工智能(ArtificialIntelligence)这一术语,标志着人工智能学科的诞生。60年后,AlphaGo战胜李世石,确立了人工智能新的里程碑。智能时代正在到来,站在人工智能的历史性关口,斯蒂芬·霍金、雷·库兹韦尔、尤瓦尔·赫拉利等一大批国际学者对人工智能的未来做过大胆预测。人工智能已上升为国家战略,国家“科技创新2030 重大项目”将新增“人工智能2.0”。最近,我国一批院士以及专家学者对未来人工智能和人工智能2.0进行了深刻阐述。近年来,本人承担了人工智能相关的课程和项目,也一直在苦苦思考。本文根据本人在中国计算机学会计算机视觉分会“CCF-CV走进高校系列报告会(第二十九期)”中的报告整理而成,分享对未来人工智能的若干初浅思考。若有不当之处,敬请指正和谅解。

一、从AlphaGo看人工智能现状

1、AlphaGo是谁?

根据世界围棋排行榜,AlphaGo的工作单位是Google DeepMind,性别:无,国籍:英国。它的战绩为,2016年一月份胜了欧洲冠军,两个月后胜了世界冠军,当时,有同学问我,如果AlphaGo和柯杰下,谁赢?当时,我说,我猜AlphaGo赢,因为AlphaGo是在科学原理上赢了李世石。很不幸,我猜中了。2017年1月份对决柯洁等,60胜1和,聂卫平随后在微博上赞叹:“它是围棋上帝派来给人类引路的”。


*来源:www.goratings.org,2016.7.1

2、AlphaGo为什么能赢?

围棋是棋类游戏的皇冠上的明珠,最复杂的棋类游戏,最能体现人类智慧。在这么一个19*19的棋谱上,它的搜索复杂度高达250^150。

这有多复杂?

这是宇宙级别的复杂度,根据天体物理,整个宇宙粒子数量在10^80级别。由此可见,围棋有多复杂,这也是AlphaGo震撼人类的原因。我们知道人类高手下围棋主要靠宏观的直觉,加上局部的计算。AlphaGo能够赢在于利用最新的深度学习技术,模仿高手,并通过自我学习超越高手。

AlphaGo的第一招:模仿高手,学习高手的棋形。

要模仿高手棋形,AlphaGo需要一个分类器来判断棋形象不象高手的棋形。围棋盘可以看成是19*19的图像,虽然这个图像很小很小,但是有250^150种变化,要对这些变化分成高手棋形、非高手棋形,是一个挺难的机器学习问题。难就难在高手棋形的特征不好定义、不好提取。在人脸识别、车牌识别中,我们可以定义颜色、边缘、关键点等特征,显然围棋棋形的特征不能这样定义。深度学习是一种最新的特征学习方法,能够自动学出好的特征。

AlphaGo用了最新的图像分类器,叫深度卷积神经网络(DCNN)。不同于传统的人工神经网络,他层数特别多,学习和分类的能力特别强。神经网络1943年就提出来了,50年代末和80年代中兴起过两波研究热潮,以前的人工神经网络层数很浅,一般只能训练两个隐层,只能解决一些简单识别问题。2000年左右,G. Hinton等提出了一套预训练后向传播的方法,当时就能训练10几层,现在的深度学习能够学习100多层。DCNN是专门针对图像识别的深度学习方法,对局部图像进行卷积计算,效率很高。



*来源:图片来自于互联网

Nature上有一篇介绍深度学习的综述,G. Hinton、Y. Lecan、Y. Bengio等深度学习三巨头是共同作者[1]。Hinton、Lecun相继去了Google、Facebook,而Bengio继续留在学术界。这是一个非常有意思的现象。一方面,深度学习跟以前的学术热点不太一样,之前,学术界曾经有过很多的热点,但工业界很少跟进,更谈不上花巨资去学术界挖著名科学家。Hinton、Lecun到工业界兼职,说明深度学习是真正有用的,有可能改变产业格局。另一方面,深度学习的成功更多是在应用层面的,很多理论问题还不清楚。两人去工业界,一人留在学术界,是一种很健康的现象。

深度学习能够发挥巨大威力的前提是,要有大量的数据用来训练深度结构,深度学习会涉及到到上百万、甚至上亿的参数,如果数据不够,很容易过拟合、降低性能。而要进行这样大规模的训练,就要有超强的计算能力。其实DCNN 1998年就提出来了,当时只能解决NIST符号识别问题,现在能够解决ImageNet问题,其使用的深度学习结构基本没变,主要是用了更强的CPU和以前没有的GPU,并且用了千万倍的训练图像。据说,AlphaGo存有15万职业棋手、百万业余高手的棋谱,训练的时候会用到1202个CPU,176个GPU。现在GPU服务器在深度学习研究中已经是基本配置。



*来源:Fei-Fei LI,ICME2016大会报告

AlphaGo的第二招:自我学习,自我进化。

模仿高手还不足以超越高手,要超越顶尖高手,AlphaGo用了一个自我学习的方法,就像金庸小说《射雕英雄传》中的老顽童周伯通,左右互博,自己跟自己学。AlphaGo可以开出两个程序,自己跟自己下。高手也会自己跟自己摆棋谱,高手摆棋谱摆得慢,需要吃饭、休息。而阿尔法狗只要有电,就一直可以左右互博下去,这就使得阿尔法狗有可能超越高手。



为了达到左右互博的效果,AlphaGo用了一个叫深度强化学习的技术,Google 2014年收购DeepMind后, 申请了深度强化学习的专利。强化学习很符合智能体的学习规律,小孩在不断跌倒中学会走路,猴子在胡萝卜加大棒下学会做马戏。强化学习的特点,一方面是Agent通过环境交互中学习,另一方是,训练标注稀少,奖赏在现实世界中,通常是不轻易使用的,并且通常是有一定延时的。比如,孩子考试考得好,我们会给点奖励,但是考试不是经常考,考完要有一段时间才能知道结果。

强化学习主要包括感知、行动、奖赏三个环节,构成一个状态转移空间。学习过程可以用马尔科夫决策过程来表示。以前的强化学习的算法训练只能解决很小的状态转移空间。AlphaGo面临的是一个超大转移空间的问题,同时还是一个带有超长延时训练标注的问题,一开始的棋,不太好量化好坏,直到很后面才能够数出各自大概的目数,判断输赢,这就可以归结成为一个深度强化学习问题。这个问题恰恰可以用深度的递归神经网络(DRNN)解决。DRNN的训练和前面的卷积神经网络没有太多的区别。




在左右互博中,AlphaGo 局部会采用一种叫蒙特卡洛搜索树的随机策略进行搜索,先用前面提到的CNN的简化版本,快速定位比较好的落子方案,同时通过随机策略,给了其他位置一定的概率。随机策略使得整个系统能够自我进化,简化的CNN兼顾了速度和效率。

把两招合在一起就是:深度卷积网络,模仿高手,寻找好的落点;深度强化学习,形成左右互博,自我进化。深度强化学习另外一个副产品就是产生了海量的对局,用来充实深度卷积网络的训练数据,两招完美结合在一起。




3、再论AlphaGo是谁?

AlphaGo是最新深度学习方法、棋谱大数据以及最新超算体系的总和,它还以现代科学技术指数发展原理继续进化,并且没有任何情绪波动。既然AlphaGo是这样的一个人工智能系统,是不是它已经在科学原理上已经战胜了人类棋手?在此我想说,作为人类个体的李世石、柯洁们,虽然告负,但对人类整体来说,这无疑是人类自我挑战的新的里程碑!




二、未来人工智能和AI2.0国家战略

1、漫谈未来人工智能

关于未来,尽管以AlphaGo为代表的现在人工智能已具备了很高的水平,但还有很多的局限性。中科院院士谭铁牛在2016年中国人工智能学会年会《关于人工智能发展的思考》报告中,曾经总结过四句非常有意思的话。我是这么理解的,我的理解不一定对。

第一句是“有智能没有智慧”。智能就是“能干”,现在AI能做好非常具体的事,比如扫地、下棋,但是不具备灵性,不能创造。

第二句是“有智商没有情商”。如果让阿尔法狗训练一下智商测试的题目,估计智商可能会爆表,科大讯飞的人工智能要参加2020年高考,据说要争取考上大学本科,但估计情商还是很低。

第三句话是“会计算不会算计”。现在人工智只有“解空间”层面的局部策咯,没有“问题空间”层面的宏观战略,不会挖坑、下套这样的高级博弈。

第四句话是“会专才不会通才”。主要说现在人工智能举一反三的能力差。

基于此,未来人工智能应该做“四有新人”,也就是有智慧、有情感、有算计、有通才的新一代人工智能。当然,要实现这样的强人工智能,人类还有很长的路要走。



2、AI2.0国家战略

我国正在大力发展AI,“人工智能,中国之崛起”,对此,我们可以大有信心。AlphaGo的例子我们知道,AI由三部分构成,机器学习是AI的大脑,超算是AI的躯体,大数据是AI成长的养分,据统计43%机器学习相关论文是中国人写的,我国已经有众多的AI人才,这形成了AI垂直产业应用的人才基础。超算方面我们的太湖之光、天河二号排名世界前二,我国发展人工智能具有很强的硬件基础。大数据方面,相对欧美日等国家,我国不仅拥有更多的“冷数据”(包括人口、地理等静态数据),而且用用更多样的“热数据”(比如交易、诊疗等动态数据),大数据优势将促使我国形成特色,在人工智能时代弯道超车。



人工智能已经上升为国家战略,国家“科技创新2030 重大项目”将新增“人工智能2.0”[2]。潘云鹤院士于2016年12月在中国工程院院刊Engineering(主刊)发表了论文“Heading towardartificial intelligence 2.0”,提出了人工智能2.0的核心理念“基于重大变化的信息新环境和发展新目标的新一代人工智能”[3]。2017年1~2月,中国工程院院刊信息与电子工程学部分刊Frontiers of Information Technology & Electronic Engineering出版了“Artificial Intelligence 2.0”专题[4],该专题分为六大方向,潘云鹤、李未、高文、郑南宁、吴澄、李伯虎、陈纯等多位院士以及专家学者对人工智能2.0中所涉及的大数据智能、群体智能、跨媒体智能、混合增强智能和自主智能等进行了深刻阐述。

三、未来人工智能视觉感知的思考

1、未来人工智能:类人服务、超人感知

根据国内外专家,未来人工智能有很多、很高远的愿景。我个人理解,至少其中一个愿景是“类人服务、超人感知”,也就是,以类人的方式服务人类自身,以超人的方式感知外部世界。在智能时代,人类智能与人工智能相互增强,相互对偶,类人服务要求具备类人智能:从人类的视角看,未来人工智能应该在感官和思维上像人;从机器的视角看,未来人工智能应该能够理解人的行为和情绪。

在传统社会是一个二元空间,人类社会和物理空间形成互训关系。在信息社会,人、机、物三者相互融合,形成一个三元空间,未来人工智能能够进行人、机、物信息的整合,以超越人类的精度和时空尺度,感知三元空间的信息关联性。多学科的研究,特别是脑计划的研究,将进一步夯实机器学习的理论基础,三元空间的大数据和超算能力将进一步提高机器学习的工程能力。机器学习、大数据、超算三者共同推动未来人工智能超人感知、类人服务的愿景。下面就这个愿景,稍微做点技术上的展开思考。




2、类人智能

类人智能就是要将类人知觉和类脑思维整合在一起,如果机器人具备逼近人类的人机交互能力,那么现在击败人类的阿尔法狗就有可能进化到陪伴人类下围棋的BeltaGo(或称之为“陪Ta狗”?)。



*来源:图片来源于互联网

在知觉层面,随着低成本、低功耗传感器的发展,未来人工智能要在视、听、味、触等不同的模态上实现对现实世界的感知和认知。具体到视觉感知,深度学习三巨头在2015 Nature上的综述论文,介绍了用CNN+RNN实现看图说话。反过来,语言能不能驱动机器视觉?我们说一句话,能不能把对应的物体定位出来?更难地,能不能自动造出来一张与这段话对应的图像?最近,生成式对抗网络(GAN)在图像自动生成方面取得重大进展[5]。如果图像和语言能够双向翻译,这将使得人工智能的视觉知觉达到一个全新的高度。

在思维层面,未来人工智能要实现类脑计算。2014年IBM 发布了类脑芯片TrueNorth,集成了100万个“脉冲神经元”,能力相当于一台超级计算机,功耗却只有65毫瓦,主要是因为它采用Spike NN结构,用类脑的异步脉冲来驱动电路,而非传统电路的同步时钟。但它还没办法高效模拟另一个重要大脑机理,也就是触突的可塑性,因此,性能离大规模商业应用还有一段距离。

从长远来看,研究类脑计算是通往强人工智能的有效方法[6]。传统的计算机相当于左脑,擅长逻辑思维,处理数字;神经元芯片相当于右脑,擅长形象思维,处理图像。IBM正想办法将两者整合在一起实现全脑的类脑计算。



*来源:图片来自于互联网

3、三元空间感知:人机物协同感知

超人的三元空间感知,在侧重物理空间的感知层面,科学家正在研究人机物协同感知。突破肉眼感知的局限性是人工智能的传统强项,目前太赫兹技术得到很大的进步,上海交通大学跟相关公司合作,在研究太赫兹图像识别,有可能在5-10米外就能够识别藏在人身上的刀枪甚至毒品。2017年3月,上海交通大学还跟联影公司成立了医学影像先进技术研究院,合作研究成像装备和大数据诊疗。可见光谱、红外光谱、太赫兹、核磁共振等一起实现全谱感知,相当于赋予了人类以天眼、慧眼。




人机物协同感知的一个重大应用就是无人车。在美国加州,全功能的无人车已经允许上路。MIT Technology Review将自动驾驶卡车评为2017年10大突破技术。百度成立了无人车事业部,也在硅谷设立了专门的研究院。



4、三元空间感知:群体智能

超人的三元空间感知,在人类社会层面,正在涌现出群体智能新技术和社会计算新学科,利用互联网、社交网络、通信网络、监控网络等不同网络的大数据,克服传统社会学调查方法数据稀少的问题,更好、更快地分析人群、组织和社会的行为。上海交通大学较早开展了这方面的探索,2009年承担了973项目“混合网络下社会集群行为感知与规律研究”,联合了信息学、管理学、社会心理学等不同领域的专家开展交叉研究,一些成果为国家提供了决策。我本人承担了其中“大尺度跨媒体社会集群行为感知”课题,结合网络媒体和视频监控,为世博会、亚信峰会等大型活动管理提供了技术支持。





在973课题基础上,我们最近承担了国家重点研发专项课题,开展大规模人群透彻感知研究,针对反恐维稳、智慧城市、交通控制等需求。利用大数据和深度学习的优势,进行多尺度、跨相机、跨平台分析,有望实现群体感知从简单、低密度、小范围场景到复杂、高密度、大范围场景的跨越。



5、三元空间感知:互联网超级智能

超人的三元空间感知,在侧重信息空间的层面,未来学家认为互联网正在向超级智能的方向不断进化,形成互联网、人工智能和人类大脑的联合智商,互联网与人类大脑高度相似,它将具备自己的视觉、听觉、触觉、运动神经系统,也会拥有自己的记忆神经系统、中枢神经系统。2011年谷歌提出了“谷歌大脑”计划,以大脑功能区,重新定义Google的业务群。最近,我国也推出了中国脑计划。



*来源:图片来自于互联网

四、关于未来人工智能的社会经济影响的思考

未来,强人工智能将深刻改变人类生活,也给人类带来巨大挑战。霍金称人工智能或威胁人类,马斯克认为人工智能是在“召唤魔鬼”。尽管我们可以相信人类能够和人工智能包容发展,至少我们要注意两方面的挑战。

一是改变就业结构。不仅大量的流水线工人正在被替代,大量的白领工作岗位也将消失。十几年前IBM深蓝打败了卡斯帕罗夫,今天我们还是不能小看IBM,AlphaGo还在打名气,IBM的读片机器人已经开始上岗。华尔街的量化交易机器人正在替代金融交易员,“今日头条”的推荐机器人正在替代初级的内容编辑。

二是强人工智能将冲击伦理关系。机器人保姆带大的小孩,还会不会跟亲妈亲?如果美女机器人拥有非凡魅力,人口数量和结构会带来怎么变化?植入了智能器官甚至机器大脑的人,还算不算人?

进一步,我们假设有一天“阿尔法狗”遇上“薛定谔的猫”的时候,也就是当强人工智能运行在量子计算机上的时候,我们的未来会怎样?



未来,机器人会是怎么样?未来学家们可能正在研究,机器人会不会做梦(意识)?机器人会不会结婚(性别)?机器人会不会用钱(信用)?机器人会不会统治人类(政治)?

未来,人类自身会怎么样?从历史观看,尤瓦尔·赫拉利不仅写了《人类简史》,还写好了《未来简史》,认为人类会从智人演化到智神。




未来,人类自身会怎么样?从生物观看,人类的密码在基因,基因分析是典型的计算密集型问题,这种单一任务的工作恰恰可能是人工智能的传统强项。有了基于量子计算的强人工智能后,人类是不是最终会全面破解基因?很久很久以前,亚当和夏娃遇上了那条蛇,偷吃了智慧之果,被逐出伊甸园。亿万年后,他们的后代遇上了一只“狗”和一只“猫”,打开了强人工智能的魔盒后,会不会摘下传说中生命树上的长生之果?这一切,人性中的欲望和贪婪,是否冥冥中早已注定?




*来源:图片来源于互联网