专栏名称: 大数据文摘
普及数据思维,传播数据文化
目录
相关文章推荐
数据派THU  ·  牛津大学等提出P-sLSTM,释放LSTM在 ... ·  昨天  
人工智能与大数据技术  ·  Meta被曝AI训练「黑幕」!下载81.7T ... ·  3 天前  
人工智能与大数据技术  ·  41岁DeepMind天才科学家去世:长期受 ... ·  2 天前  
数据派THU  ·  数据派志愿者招募 | 寻找最志同道合的你! ·  6 天前  
51好读  ›  专栏  ›  大数据文摘

汉化视频 | Yann LeCun亲自上镜,三个视频解读人工智能

大数据文摘  · 公众号  · 大数据  · 2016-12-03 07:02

正文


大数据文摘字幕组出品 转载具体要求见文末

素材| Aileen 听译| 徐凌霄
校对 | 蒋晔 汤人懿 田晋阳
后期 | 黄庆俊 编辑 | 魏子敏


没错!大数据文摘字幕组本周最新作品出炉啦!


本期的三个直观的在线教育小视频来自Facebook 人工智能研究实验室,其中两段更是由实验室负责人、深度学习大咖Yann LeCun 亲自上镜解说的。


Yann LeCun在视频中提到: 让普通人了解人工智能是什么很重要,所以这段视频不是一门课程,但可以帮助人们真正理解机器学习所蕴含的基本原则,并可能激发年轻人或高中学生,去探索了解更多 ”。


如果你对人工智能听了太多却似懂非懂,那么希望这几个小视频可以激起你对机器学习学习的好奇心,当然在此之后,也可以通过阅读(关注大数据文摘哦),或者选修一门线上课程(文末海报有惊喜),在这条路上走得更远。


Facebook 正在创建一系列在线教育视频,介绍人工智能如何运作。我们希望通过汉化这些简单精炼的介绍,帮助每个人了解这一计算机科学中的复杂领域是如何运作的。


大数据文摘字幕组 专注一切炫酷的科技、前沿类视频

如果你的英文不错,又get或者希望get一点视频技能,快加入我们吧~

点击 阅读原文 ,了解如何加入大数据文摘字幕组!


12月2日凌晨,Facebook 人工智能研究实验室主负责人Yann LeCun 和同事Joaquin Quiñonero Candela 在 Facebook blog上发表了一篇题为 Artificial intelligence revealed 的文章,介绍了人工智能的一些基本概念,并对其前景进行了预测。除此之外,这篇文章中还推出了三段教育视频,机器学习大咖 Yann LeCun 亲自上镜,介绍了人工智能的运作原理。


“很多人都很沉迷于机器智能的概念,其实我们做的非常简单,我很乐意在一定程度上为你们解释一下这是如何运作的。 Yann LeCun用这样一段话开启了他的人工智能小讲堂。


三段视频都不长,建议先收藏再观看, 没有环境看视频的读者,可以查看每段视频下方的相关视频要点,先一睹为快。


废话不多说

欢迎享用!


监督学习(supervised learning)与泛化性


本视频时长02:42,建议在wifi环境下观看,土豪请随意



视频要点:


“大多数人每天正在不知不觉中使用AI系统。训练机器最常见的模式被称为监督学习(supervised learning)。一个典型的例子是,如何建立一个机器来识别图像中是否有一只狗或者一辆汽车?”


“这里是诀窍就是,不仅要懂得如何建立一个机器,更要懂得如何调整机器的内部结构,之后机器才有可能给出正确的答案。”


”所谓学习的算法,其实就是调整参数的技术。你用成千上万的案例去不断的调整参数。”


“我们称此为泛化性。该能力便是能够识别与被训练的案例相似但从未见过的物品。”


图像识别



视频要点:


通常,计算机使用被称为算法的一系列精确的指令进行编程。算法是一个简单的指令序列。


但怎样可以写一个算法来识别图像呢?例如区分一张图是汽车还是狗。实际上连仅表达出车与狗的差异都很困难。


我们在做的一件事便是,事实上人类已经做了数个世纪的,将需要识别的图像与一系列已经记住的模版做比较。


问题是这样做并不够好,因为这个工作过程中我们将需要海量的模版。我们需要各种可能位置、颜色、姿势的狗的图片,对汽车也是如此。所以这一方法在实践中并不太可行。这便是机器学习方法需要被使用的地方了。


我们所做的不是编程识别狗和车,而是给机器展示了许多车和狗的样例,训练其分辨它们。这里有个非常简单的方式。假设说,我们的图像都只有九个像素,我们不是区分狗和车,而是识别出字母C和字母D,假设D代表狗(dog),C代表车(car)。假设,对于黑白图像,黑色像素取值为1,白色像素代表0。我们的机器学习算法所做的非常简单,它将计算图中像素的加权和。也就是说,你取出图像中的每个像素,将每个像素乘相对应的权重,再将其它们相加起来便得到了加权和 (weighted sum)。然后你将这个加权和与零做比较,如果它大于0,便认为是字母C,小于0便得到D。


便有个问题是,权值应该被给予什么值?权重需要使得D小于零C能大于零。我们将做的是,展示一系列的C和D样例图片,通过一系列学习过程,即处理该机器中全部的权重,你可以视权重的模型为一种我们将用于全部样例的模版。那我们应该怎样做以调整权重呢?


我们输入了一个C,我们告诉机器将相应的权重变大一些。机器将做的便是提升看到的所有C中的黑色像素的权值,降低或保持C中白色像素的权值。


反过来相同的方法对D,D的权重和需要小于0,所以我们将通知机器调整权重变小点。所以机器所做的便是,降低看到的D的所有黑色像素的权值,保留其它位置的值不变。最后,你将得到正权值在所有只属于C的像素处,以及负权制在只属于D的像素处,这便是一个完美的模版来分辨C和D。现在,当你提供图像C,计算权重和,和大于零所以被正确的分类为C,当你展示D,计算结果小于零,所以被分类为D。


当然现实生活中,我们关于每个字母和形状有不只一种样例,运行生成这些模版将可能花费更长的时间,或者更复杂,但这就是基本原则。


卷积神经网络



视频要点:


深度学习中有一类特别的系统我们称之为卷积神经网络,这是指是神经网络中结点与单元之间特别的连接方式。这种连接方式在一定程度上受我们所知的哺乳动物的视觉皮层结构启发。做卷积的原因主要是因为物体可能在一张图像中的各个不同位置出现。


举例,如果我拍了张剪刀的图像,它能出现在图中的不同位置显出不同的样子,此外,可能我希望我们的系统还可以识别其它类型看起来不相同的剪刀。例如,如果识别这个特别的剪刀,我需要一个探测器去识别这个洞,那么我需要你知道识别出来它在某特定的位置。所以我设计了一个探测器来识别这个特殊的模式,我希望运用这个探测器来用于整个图像,从而当这个剪刀出现,探测器可以被触发并检测出图像上有这样一个特殊的形状。所以,我们的思路是用这个探测器来重复的在这张图片的每一行上寻找这个形状(小洞),这便是卷机操作。


第一层的卷积网络就像有上百个不同的detector去寻找不同的模式。而我们所做的并不是手动编写去建立这些detectors来尝试找有助于识别出剪刀的模式 从其它物体中,如汽车、狗。这只是学习过程的一部分,这些detectors自我训练以至能够识别(分辩不同物体)。这个技术被用于几乎任何地方,如图像识别,分析图片用于自驾驶汽车,语音识别,也用于是被部分场合进行语言文字的识别理解。


---- 【广告】 ----

本课程报名已超

500 人,

扫码加入,与更多人一起,

筑起机器学习中的数学板块!








请到「今天看啥」查看全文