专栏名称: TFT小组
XDF土鳖,CMU码农, 分享口语学习经验, 分享北美留学感受。
目录
相关文章推荐
北美留学生观察  ·  惊了!马斯克刚警告别坐飞机,才两天美国飞机又 ... ·  22 小时前  
北美留学生观察  ·  回国北漂的00后留学生,正在组团“逃”离… ·  昨天  
北美留学生观察  ·  3000名员工在家上班,东北姑娘狂赚63亿 ·  2 天前  
移民(微博搜索)  ·  移民(微博搜索)-20250308-3 ·  3 天前  
移民(微博搜索)  ·  移民(微博搜索)-20250308-3 ·  3 天前  
移民(微博搜索)  ·  移民(微博搜索)-20250308-3 ·  3 天前  
51好读  ›  专栏  ›  TFT小组

全世界最简单机器学习指南(一)

TFT小组  · 公众号  · 留学  · 2019-09-10 20:30

正文

点击上方蓝字,关注最有趣的ML小组


当别人在如火如荼地讨论机器学习时,你却一头雾水,怎么办?在与同事的聊天中,你只能靠频频点头来装作听懂机器学习,怎么办?不要怕,让我们一起来改变这种现状!


Adam Geitgey 撰写了一份被称为“全世界最简单机器学习指南”——《机器学习,乐趣无限》,主要针对所有对机器学习感兴趣,却无从下手的小白朋友,我们希望能借此指南让更多人认识并了解机器学习,激发对机器学习的兴趣。



相信很多人曾经尝试搜索并阅读机器学习的维基百科词条,但是读着读着倍感挫折,然后放弃挣扎,他们迫切希望能有人给出一个更直观、准确、高水平的解释。这篇指南就是读者想要的东西!


这篇指南想让任何人都能看懂这篇文章,这就意味着文章中有大量的概括性定义。但是who cares?只要能让读者对机器学习更感兴趣,这篇文章的任务也就完成了。



什么是机器学习?


机器学习是用 泛型算法(Generic Algorithms) 用来解释关于一组数据的有趣结论,而这个过程中你不需要编写任何与问题有关的特定传统代码。不需要写代码、编程序,只需要把数据交给这个泛型算法,它就能根据数据建立起自己的逻辑。


举个例子:有一种算法被称为分类算法(Classification),它可以将数据分为不同的组。这种分类算法可以用于识别手写数字0-9。更神奇的是,在不修改几行代码的情况下,它同样也可以做到区别垃圾邮件和非垃圾邮件。唯一要变的就是给这个分类算法输入不同的训练数据,它就能得出不同的分类逻辑。


KNN算法实现手写数字识别


机器学习算法像是一个黑盒子,我们可以重复使用它处理许多不同的分类问题


“机器学习”是一个伞状结构体系,除了分类算法以外,还覆盖了大量类似的泛型算法。


大体上,你可以把机器学习算法分为两大类:

  • 监督学习(supervised Learning)

  • 无监督学习(unsupervised Learning)

那么,什么是监督和无监督呢?


监督学习


假设你是一名房地产经纪人,你的生意蒸蒸日上,因此你雇了一帮新的实习代理来帮忙。但是接踵而来的问题是:你可以一眼估算出一间房子的价格,但是你雇来的实习代理却不像你一样经验丰富,他们不知道怎么样对房子进行估价。


在这种情况下,善良帅气的你为了帮助你的实习员工(当然同时也是为了给你自己放假),你决定编写一个能对房屋进行估价的小软件/小程序?,这个软件能够根据房子的 大小 地段 以及 同类房屋成交价 等因素来对房子进行价格预估。


在接下来三个月,你记录了你所在城市三个月内所有房产交易的信息。针对每笔交易,你需要记录下一系列细节信息,比如:卧室数量、房屋大小、地段等等。还有最重要的是,你写下了最终的成交价:


“训练数据”(Training Data)


我们想通过这些训练数据来编写一个能够估算该地区其他房屋价格的程序:


用训练数据来预测其他房屋价格


这就是人们所说的的 监督学习


你从一开始就知道了每间房子的价格,换句话说,你已经知道了一个问题的答案,而且你可以反向找出解决这个问题的思路和逻辑。


那么建立一个能预估房价的应用程序,你需要把关于每间房子的数据信息——“训练数据”——输入你的机器学习算法中,算法就会得出用于解决这些数据关系的一套数学公式。


这就有些像你已经知道数学考试的答案,但是题目中算式的运算符号都被涂掉了,就像下面这张图(有没有当年做奥数的感觉~)。


天啊!老师答案纸上的算术符号不知道被哪个淘气的学生都涂掉了!


这个时候你应该很难看出这次考试考的是什么数学问题,到底是加法还是减法???


所以要解决到底是加法还是减法的问题,你这时就需要对左边和右边的数字进行一些“计算加工”来弄清他们之间的关系了。


在监督学习中,你可以让计算机帮你完成一系列的“计算加工”工作。而一旦你知道了解决这类特定问题所需要的数学方法后,那么类似的问题也就迎刃而解了!


无监督学习


让我们回到房地产经纪人的例子。假如就连作为房地产经纪人的你,对每间房子的价格都不确定,那该怎么办?如果你了解到的只有房子的大小、位置等信息,那也没关系,接下来介绍的无监督学习也可以搞出很酷的东西。


即使你并没有打算预测未知的数据(如价格),你也可以运用机器学习做一些有意思的事。


这就像有人给你一张纸,上面写了一串数字,然后告诉你:“我不知道这些数字有什么意义,但是你也许能找出些规律或是把它们分类什么的——祝你好运!”








请到「今天看啥」查看全文