专栏名称: 码农翻身

工作15年的前IBM架构师分享好玩有趣的编程知识和职场的经验教训，不容错过。

目录

相关文章推荐

程序猿 · 酒店开房订单“订后即焚”被指“鼓励出轨”，涉 ... · 昨天

架构师之路 · 2024程序员，转行还是不转行，必须严肃想一 ... · 3 天前

程序猿 · IT工程师在工作电脑存储64G不雅视频，公司 ... · 2 天前

待字闺中 · AI 编程——产品篇 · 6 天前

美团技术团队 · 美团机器人研究院｜2024年科研课题申报指南 · 2 周前

51好读 › 专栏 › 码农翻身

漫画：什么是机器学习？

码农翻身 · 公众号 · 程序员架构 · 2016-10-27 11:43

正文

前言：这是来自网友玻璃猫的投稿，很有趣的关于机器学习的科普。

来自：梦见 (微信公众号: dreamsee321)

作者：玻璃猫

在一个风和日丽的周末......

故事一：瑞雪兆丰年

我们中国有一句关于农业生产的古老谚语：瑞雪兆丰年。

就是说，如果前一年冬天下雪很大很多，那么第二年庄稼丰收的可能性比较大。

这条谚语是怎么来的呢？我们可以想象当时的情景：

第一年冬天

第二年收获时节

第二年冬天

第三年收获时节

第三年冬天

第四年收获时节

年复一年，若干年后的冬天......

这就是瑞雪兆丰年的故事。头年的瑞雪和来年的丰收，本是两个看起来并不相关的现象，但是智慧的农民伯伯通过几十年甚至几代人的经验，总结出了两个现象之间的规律。

现代的农业学家通过科学的分析，弄清了瑞雪兆丰年规律背后的本质原理。但是对于古代农民伯伯来说，知道规律就足够了，可以通过规律来为下一年的生产生活做出有效的调整。

故事二：啤酒和尿布

上个世纪90年代，沃尔玛超市已经是美国最大的零售企业，拥有大量的顾客资源。那时候的沃尔玛已经采用了先进的计算机技术，随时记录着每天众多顾客购物车中所挑选的商品明细。

在其中一个普通的日子里：

就这样经年累月，沃尔玛积累了大量的顾客购物数据。直到某一天，沃尔玛的技术专家发现：

于是，这一尝试实行以后......

从此，沃尔玛的销售额得到了显著提升，啤酒尿布的故事也广为流传，成为了销售界和IT界津津乐道的成功典范……

这就是沃尔玛啤酒和尿布的故事。顾客购买啤酒的行为和顾客购买尿布的行为，原本是两个看起来没什么关联的现象。但是沃尔玛的技术专家以大量的用户购物数据为样本，通过先进的算法，最终寻找到了两者之间的重要关联和规律。

为什么购买啤酒的人更有可能同时购买尿布呢？是因为有了小孩的男人比别人更爱喝啤酒？还是因为爱喝啤酒的男人比别人更顾家？这些臆测似乎都有些牵强。

但是沃尔玛不需要关心规律背后的本质。对企业来讲，利用发现的规律，获得实实在在的利益就足够了。

以下是小灰根据个人理解说画的流程图：

以下是大黄基于小灰的流程图所做的补充：

以下是大黄对流程图结果部分作出的调整。其中假设模型可以理解成训练出来的降雪和收获的规律，通过假设模型，从新一年降雪情况推断出下一年收获情况的过程叫做回归。至于啤酒尿布的例子，属于截然不同的机器学习类型，只需要找出关联关系，并不需要进行回归。

机器学习按照方式不同主要分为三大类，有监督学习(Supervised learning)、无监督学习(Unsupervised learning)以及半监督学习(Semi-supervised learning)。

监督学习：通过已有的一部分输入数据与输出数据之间的对应关系，生成一个函数，将输入映射到合适的输出。在瑞雪兆丰年的例子中，头年降雪量就是输入，来年亩产量就是输出。

非监督学习：直接对输入数据集进行建模，寻找关联。例如啤酒尿布的例子，只需要寻找关联性，并不需要什么明确的目标值输出。

半监督学习：综合利用有输入输出的数据，和只有输入的数据来进行训练。可以简单理解成监督学习和非监督学习的综合。

这里所介绍的相关知识，只是作者对机器学习领域的一点皮毛了通。过这篇漫画，希望没有从过IT行业，或者不了解机器学习的朋友们能够对机器学习有一些初步的认知。

希望有经验的朋友们对本文提出宝贵意见，指出其中的纰漏和不足，非常感谢！

（完）

你看到的只是冰山一角，更多精彩文章，尽在“码农翻身” 微信公众号，回复消息"m"或"目录" 查看更多文章

有心得想和大家分享？欢迎投稿！我的联系方式：微信：liuxinlehan QQ: 3340792577

公众号：码农翻身

“码农翻身”公众号由工作15年的前IBM架构师创建，分享编程和职场的经验教训。

掘金是一个高质量的技术社区，从 Swift 到 React Native，性能优化到开源类库，让你不错过互联网开发的每一个技术干货。长按图片二维码识别或者各大应用市场搜索「掘金」，技术干货尽在掌握中。

推荐文章

程序猿 · 酒店开房订单“订后即焚”被指“鼓励出轨”，涉事平台回应

昨天

架构师之路 · 2024程序员，转行还是不转行，必须严肃想一想？（一条120W+阅读的讨论）

3 天前

程序猿 · IT工程师在工作电脑存储64G不雅视频，公司发现后将其开除；员工辩称：我存了，但没看！赔我41万

2 天前

待字闺中 · AI 编程——产品篇

6 天前

美团技术团队 · 美团机器人研究院｜2024年科研课题申报指南

2 周前

电驹 · 实拍｜宋EV300启动预售，补贴后预售价20万元

7 年前

早安晚安心语 · 这样的爱情，你有过吗?

7 年前

中国经济网 · 全国政协委员调研法规修缮，两会后首站莅临太阳神

7 年前

Call4Papers · 【今日新增】CCF推荐国际会议截稿信息3条

7 年前

读书小分队 · 女人贵在有分寸

7 年前

Sov5搜索 · 小百科 · 移动版

51好读 - 好文章就要读起来!