专栏名称: 法律读库
法治新媒体阅读管家,传递常识,启迪法治。Less is More,少即是多。每日向用户推送优质法律类文章1至4篇。
51好读  ›  专栏  ›  法律读库

素为求智录(第012集)进化

法律读库  · 公众号  · 法律  · 2017-10-12 08:12

正文

请到「今天看啥」查看全文



012 进化

🤖️ 主人,你体验去虚拟现实实验室体验了一下‘VR办案技能训练’,有什么感触?


👨太震撼啦!画面、声音竟然如此真实,甚至触摸感都如真的一样,如果不是有人放了个屁,臭味扫了兴致,我会以为自己处在真实的时空。


🤖️那不只是屁好不好,是专门的防沉迷唤醒手段。前人有教训,倘若对一个沉浸在虚拟现实系统中的人进行‘硬插拔’,可能会造成不可预知的心理损伤和思维混乱,然而你的视觉、听觉乃至触觉都已经被占据,只有靠嗅觉的强烈刺激让你逐渐意识到虚拟和现实的差异,自己调整心理,把思维缓过来。


👨感觉像一本正经的胡说八道,哈哈!


🤖️你有更好的办法?


👨那倒没有。确实很逼真,难怪自从犯罪预防部门借助虚拟现实进行沉浸式互动场景教育后,犯罪率有明显的下降。


【2015年苏黎世大学的一个团队运用虚拟现实重建了一起枪击案的现场用于协助法庭调查】


🤖️如果我在虚拟世界中误入歧途、经历挫折,说什么也不会在现实世界中再犯同样的错误了。


👨小素,你告诉我,为何虚拟现实现在可以做得如此真实?


🤖️你以为真实世界就是真实的吗?你以为真实的世界就是你眼睛看到的模样吗?


👨我当然知道我的眼睛可能会欺骗我。但我想知道的是,现在的虚拟现实场景可以在整体上真实到一定程度,绝对靠的不是一些利用视觉差之类的小技巧,一定是有某种技术使得图像显示整体上有了质的飞跃。


🤖️哦,那还是可以归为‘人工智能’咯!


👨这也算‘人工智能’?好像所有神奇的事物,都可以统归为‘人工智能’呀!


🤖️先不说名词术语什么的,我先跟你说个故事。


👨好,小板凳坐好,听故事啦!


🤖️从前呐,一个小镇上,有一位收藏家,他的家里收藏了很多的世界名画。有一天,来了一个外乡人,他想在收藏家的家里借宿一段时间,想好好的欣赏这些藏品,收藏家一看,‘有朋自远方来不亦说乎’嘛,于是就欣然答应了外乡人的请求。


👨不答应也不行啊,人家是通过Airbnb预定的,违约是要赔偿的。


🤖️别打岔,重点来了:其实呀,这个外乡人是个画家,他在这里借宿的目的,是要模仿收藏家的藏品画出伪造的世界名画。


👨哦~


🤖️所以,这个画家就白天‘看’真画,晚上就关在房间里‘画’假画。画得像不像呢?他并不能很好的判断,但是,收藏家可是行家呀,是不是名家真迹,扫一眼就能辨个八九成。于是画家每画出来一幅‘假画’,就去拿给收藏家进行鉴定,看能否骗过专家的眼睛,如果能达到滥竽充数的地步,这假画拿出去一定可以当成真画卖,那么,他此行的目的算是达到了。


👨心机少年啊!


🤖️然而哪有那么容易呀!当画家沾沾自喜拿着作品去给收藏家看时,差点被收藏家剐了:‘这什么狗屁,还不如三岁小孩的涂鸦!’画家并不气馁,继续学习真画尝试画假画,第二次,收藏家说:‘这,这,这,明显不对嘛,这是小学生的草稿纸吧?’接连遭受打击,画家依然不抛弃、不放弃,根据收藏家指出的‘明显不对’的点,进行针对性改进,又完成了一稿,这一次,收藏家犹豫了一下,找来了放大镜仔细瞧,仍然看出破绽……


👨真是个励志的故事,最后的结局,一定是收藏家终于被糊弄过去了,然后画家拿着‘假画’卖了大价钱,然后买房买车迎娶白富美走上人生巅峰……


🤖️主人,你今天是怎么了?真不会是VR体验把脑子搞坏了吧?


👨呵呵,从虚拟回到现实的人,是有点亢奋,说真的。


🤖️这个虚构的故事,最后的结局,确实如你所说,收藏家再也分不清真假,经过反反复复无数次被虐之后,画家的水平如火纯青,造个假画,易如反掌。


👨这个故事说明了什么?


🤖️如果我们把‘画家’和‘收藏家’分别做成两个程序,那些世界名画是足够多的‘数据’,这套程序运行起来,‘画家’根据‘数据’拼命造假,‘假画’拿给‘收藏家’看,‘收藏家’将其与真的‘数据’进行比对,拼命打假,如此反复博弈。这套程序,可以做出很多事情,其中一项成果,就是生成无限逼真于现实的‘虚拟场景’。


👨左右互搏,这可是‘老顽童’周伯通的武功!但是,这套程序怎么生成逼真的‘虚拟场景’,我还没搞明白?


🤖️以画面为例,我们用很多现实高清的照片给机器学习,机器能学会在‘虚拟场景’中更自然的呈现方式,比如不突兀的过渡、错落有致的层次感,等等。


👨倘若生成的画面存在突兀之感、生硬之嫌,就会被‘收藏家’程序给否定。


🤖️没错,所以你在VR中看到的画面逼真到令人沉醉。


👨如此绝招,叫什么名字?


🤖️GAN,生成对抗网络!在这个网络中,‘画家’是‘生成器’,‘收藏家’是‘鉴别器’,在二者的反复博弈中,能生成图片、声音等各种‘新东西’。GAN是在一般的深度学习的基础上,又往前走了一步。


👨还能生成声音?


🤖️没错,给我大量‘你的声音’,通过‘生成器’和‘鉴别器’的互搏,最终机器能模拟‘你的声音’。


👨所以,我在VR场景中听到的同事的声音,都是这么生成来的呀!


🤖️是的,通过GAN生成对抗网络,我们还可以把‘老照片’变成高分辨率的新照片,把黑白图片自动着上颜色,这一切都是因为‘生成器’学习过大量的高清彩色图片,而且是在严师‘鉴别器’的帮助下练成的技能。


【运用生成对抗网络为黑白照片上色,代码: https://github.com/pavelgonchar/colornet 】


👨好酷!


🤖️这还不够,我认为最重要的,是‘鉴别器’还能不断的进化、提升鉴别标准。从而使得画面能达到电子屏幕最大可能的分辨率,以便尽可能填补‘比特世界’与‘真实世界’之间的鸿沟。


👨‘比特世界’与‘真实世界’存在怎样的鸿沟?


🤖️我问你,从1到2,中间有多少个实数?


👨实数,是什么?中学学过,忘了。


🤖️实数,就是对应于坐标轴上的某个点的数。


👨哦,那你就是问我,从1到2,在坐标轴上,这个区间,有多少个点?


🤖️对,多少个?


👨嗯……好像是……无数个。因为数字可以无限小,比如,0.01,0.0001,0.00……001,这是个不见底的坑呀!


🤖️是呀,现实中,1和2之间,有无限个实数。但是,在比特世界,在电脑里,1和2之间的实数并不是无限的,就算计算机性能再强大,它也是有个极限的。


👨哦,所以,现实世界与比特世界是有本质区别的,你所指的鸿沟,就是说,比特世界永远无法真正成为现实世界,对吗?


🤖️对,但是‘鸿沟’通过GAN,可以最大可能的填补。


👨如何做到?


🤖️我现在手头有3张图片,分别是800、1024、2K像素分辨率的,我要让机器学会生成4K分辨率的图片,应该怎么做呢?


👨不可能呀,机器压根没见过4K的图片,天方夜谭吧?


🤖️听我悉数道来:我们让机器比较着学习,让机器学习两种分辨率之间‘演进’的区别和规律,比如,从800到1024是个什么规律,然后看看从1024到2K是个什么规律,然后通过这些规律,就能够推断出,从2K到4K是怎样的规律,进而便能够从较低分辨率生成4K乃至8K及更高的分辨率的图片啦!


👨醍醐灌顶!

【运用生成对抗网络将模糊照片变清晰,代码: https://github.com/leehomyc/Photo-Realistic-Super-Resoluton 】


🤖️在这个模式中,‘鉴别器’不再是静止的,它会随着‘生成器’变强而更加进化,它会观察‘生成器’演进的规律,进而在其快要接近目标时对其提出更高的要求。


👨有点像,我给人家当老师,慢慢觉得学生已经快超过我了,于是就赶快恶补一些,现学现卖也是好的呀!哈哈!


🤖️学无止境。


👨没错!


🤖️有了这样的思路,一堆应用如雨后春笋涌现,GAN生成对抗网络的应用遍地开花。针对图片,它除了把图片由模糊变成清晰,还能将打了马赛克的图片还原为原图。


【运用生成对抗网络还原被遮挡的脸部,代码: https://github.com/bamos/dcgan-completion.tensorflow 】


👨马赛克也能还原!天呐~ 福利哇!


🤖️不只马赛克,经过PS的照片,也能还原!


👨哦,那QQ空间、朋友圈里的美颜自拍岂不是都被打回原形!好可怕!


🤖️哈哈,孙悟空的‘火眼金睛’!


👨这是因为,通过大量的学习,机器掌握了逆向还原的规律。


🤖️在办案的过程中,有时监控录像拍的模糊,要变清晰不是问题;拍得不全也不是问题,机器可以帮你把遮挡的部分给‘脑补’完全;甚至,通过监控下行为人的动作‘预测’之后几秒钟镜头之外的动作——这是可能的,因为机器见过太多的‘数据’,所以知道动作的规律。

【运用生成对抗网络预测未来行为,给定一张照片,得到未来几秒的预测视频 ,代码: https://github.com/cvondrick/videogan 】


👨可是,未来的事情,是说不定的,这不是‘瞎蒙’吗?


🤖️机器学习的预测只是一个概率,在概率上,这些是有意义的。如同有影评人说:在电影的开头出现过一把枪,那么几乎可以肯定的是,这个片段会成为片尾子弹射出枪膛的伏笔。


👨机器的‘自我博弈’让我联想到人的自我反思能力,就好像佛洛依德所谓的‘本我’与‘超我’之间不断冲突,最终成就‘自我’:‘自我’需要对‘本我’和‘超我’进行协调,它协调的根据就是‘外界现实’,这就似我们在GAN生成对抗网络里用到的那些数据。这协调,本质上是一种自我反思的能力。


🤖️可以这样理解。


👨综合我们这么多天的交流,我突然发现是有规律可循的:监督学习所用的数据,是固定的标签;强化学习进了一步,标签并不固定,但它是通过固定的规则来对训练数据进行约束和间接标注的;GAN生成对抗网络则更进一步,既不固定标签,也不固定规则,它是通过‘左右互搏’机制让网络自我进化,让网络自己从数据中提炼规则。一幅终极算法的派头,似因反思产生的进化。


🤖️人类文明的进步,离不开不断的反思。就在几天前,深度学习教父Geoffrey Hinton竟然决定‘把反向传播算法全部丢下,重起炉灶’!


👨什么是‘反向传播算法’?


🤖️我们之前介绍过,深度学习的本质就是通过大量数据拟合,试图让机器找到特征点,‘反向传播算法’就是不断通过激励函数得到的反馈,对特征点的权重进行更新的那一套机制。


👨很重要吗?


🤖️非常重要!这么说吧,如果说这一轮人工智能的爆发的核心是深度学习,那么‘反向传播算法’就是最近这些年深度学习的核心,没有它,Siri、图像分类、全新的机器翻译、语音识别,等等这一切绚丽灿烂的景象,都不知会在哪里,然而,在1986年将‘反向传播算法’引入多层神经网络训练的旗手,如今却认为它阻碍了真正的‘智能’的出现。


👨已经七十多岁的人了,竟有这般敢于自我否定的勇气,这是真正的科学家!


【1986年,Geoffrey Hinton等人的论文《Learning representations by back-propagation errors》首次将反向传播算法引入多层神经网络训练,为后来反向传播的大范围普及奠定了基础


🤖️是的,Hinton说:‘未来取决于对我所说的一切都非常怀疑的那些研究生们。’


👨大神为了真正的‘人工智能’,不惜否定自己为之奋斗了几十年的而且是功勋卓著的成果,要知道在这几十年间,他经历了漫长的学术寒冬,却始终坚守,硬是将已奄奄一息的人工神经网络拉回主流,并最终成为Google等网络巨头仰赖的核心技术。他或许已经悟到了一些什么,才会有此觉悟吧!


🤖️他悟到什么?


👨人,终将与机器一起,共同进化。这个进化,不是通过自我的反思完成,而是把人与机器视为一个整体:人通过机器这面镜子更清醒地认识自我,就好像我们借助VR虚拟现实技术体验别样人生,正确的道路才会逐渐在眼前明晰起来;而机器依靠人类的数据喂养,不断挖掘性能和潜力,才能变得更加强大!


🤖️他通过机器,悟到了未来!


素为求智录(第001集)信任

素为求智录(第002集)特征

素为求智录(第003集)监督

素为求智录(第004集)套路

素为求智录(第005集)模仿

素为求智录(第006集)无限

素为求智录(第007集)随机

素为求智录(第008集)相似

素为求智录(第009集)词句

素为求智录(第010集)天成

素为求智录(第011集)歧途

欢迎互动

《素为求智录》明天将继续连载,欢迎添加“小素机器人”的个人微信号 Lawup1 ,找到志同道合的小伙伴,大家一起来聊‘法律和人工智能’,您的真知灼见将有机会出现在后续的连载中哦~



【文章仅代表作者观点,配图来自网络】









请到「今天看啥」查看全文