专栏名称: TensorFlow
Google官方账号,分享人工智能和TensorFlow相关的最新消息、技术资源、活动和实践案例。联系我们:[email protected]
目录
相关文章推荐
爱可可-爱生活  ·  AI编程,一人公司时代的真正开端在即将过去的 ... ·  2 天前  
爱可可-爱生活  ·  Clone仿生器官系统的革命性突破,距离仿生 ... ·  4 天前  
黄建同学  ·  Groq API ... ·  4 天前  
51好读  ›  专栏  ›  TensorFlow

Google 系列教程开篇——机器学习是什么

TensorFlow  · 公众号  · AI  · 2018-05-22 17:31

正文

从今天开始,每周二、四我们将为大家推送来自 Google 的工程师 Yufeng Guo 主讲的 AI Adventures 系列视频/文章,下简称 AIA 系列,我们将用通俗易懂的语言帮助你了解人工智能和机器学习。

本系列主要以视频为主,文章是配合视频内容进行的讲解。欢迎关注我们的微信公众号 TensorFlow,也欢迎在线上线下的 TensorFlow 社区相互交流更多。

当今世界数据无处不在——图片、音乐、文字、表格、视频等。这些数据充斥着我们的生活,并且在相当一段时间内,数据仍然会是数字世界的主体。而机器学习给予了我们从这些无穷无尽的数据中找出规律并加以利用的可能,那到底什么是机器学习呢,请看 Yufeng 为大家录制的视频讲解:

在这个系列中,我们将一起探秘人工智能的世界,共同品味艺术,探索科学以及掌握机器学习的工具。一路上,我将为你展现机器学习的魅力并指导你亲身体会整个创造的过程。千里之行,始于足下,一切从概念开始,再逐渐深入到它们背后的技术细节。

英国著名科幻小说家 Arthur C. Clarke 曾讲过:

任何先进之技术,初看时都与魔法无异。

一开始你会觉得机器学习好似变戏法一般深不可测,但当你深入其中,会发现它不是黑魔法,而更像是通过数据来回答问题的工具。

数据就在我们身边

在过去,人们往往通过分析数据,并针对数据模式的变化来适配软件系统。但是,当数据容量超越人类的感知或模式制定能力之后,我们不得不倾向于使用那些可以从数据自主总结归纳的方式,尤其是从变化的数据中自主学习的软件系统。

机器学习早已无处不在

如今我们能够在日常生活当中瞥见机器学习的身影,但却忽视了一些难以发现的应用。比如你可能发现:Google Photos 应用自动为照片分门别类的过程利用了机器学习算法,却可能没有意识到,YouTube 等视频网站、Google 等搜索引擎的推荐算法也得力于机器学习的帮助。


如你所料,也许当前最庞大和复杂的机器学习系统就是 Google 搜索了。每一次你Google 某个关键字的过程,就是在使用一个于软件内核大量运用机器学习的系统(从理解你检索的文本,到根据用户的个人喜好调整搜索结果)。比如当你搜索「Java」时,机器学习将通过判断你的身份(是 Java 语言开发者还是咖啡大拿,亦或是二者兼有)来选择将哪些结果优先显示在你面前。

如今,机器学习的直接应用已经非常广泛了,包括图像识别、欺诈检测、推荐引擎、文本和语音系统等等。这种强大的能力被广泛应用于糖尿病视网膜病变、皮肤癌检测到零售以及自动泊车与自动驾驶运输系统等等领域当中。

备受期待的特性


起初大众对使用机器学习的公司和产品非常神往,而现在,每个公司都在探索把机器学习应用到自身产品。而今这也成为了大家对现有产品的普遍期望,正如当初我们希望每个企业都有一款好用的 App 或者一个漂亮实用的网站那样,不久的将来,人们将会希望这些技术或服务都更加个性化,都能深入洞悉用户需求并且还具备一定的自我纠错能力。

我们希望机器学习能够让现今的任务办得更好、更快、更轻松,同时也希望在未来,机器学习可以帮助我们实现一些曾经通过人力无法完成的工作。

我们应当庆幸,要充分发挥机器学习的优势并不困难。利刃早已磨好,你要的就是数据、开发者和强大的意志力来挥舞宝刀!

使用数据来解决问题

此处我们可以将机器学习的定义简化为 8 个字:

『使用数据解决问题』

这一表述也许太简单了,但却足以充分表达我们的目标。尤其是当我们将这句话拆分成两个部分:「使用数据」和「解决问题」,我们会发现两者充分勾勒出机器学习的两个重要层面(训练和预测)。

「使用数据」也就是常说的「训练」,而「解决问题」则被当作是「预测」或是推理的过程。

将这两者联系起来的部分叫做模型。我们使用数据集来训练模型以实现更好、更有用的预测。训练完成后,这一模型就可以通过部署来预测未曾出现过的数据。

数据是核心

如你所见,在整个流程中最关键的部分就是数据

训练出一个模型需要数据作为关键的支撑,通过不断微调后训练出来的模型将会用于从更多数据背后帮助你找出答案。

下期预告

这篇文章仅仅只是在鸟瞰机器学习这块沃土,解答为什么它如此有用。机器学习是一个非常广阔的领域,涵盖了一整个与「从数据推断答案」相关的技术栈群。接下来,我们将致力于为大家提供如何根据给定的数据集和问题挑选合适的方法来解答,同时还会提供相关的实现工具。

这是 AIA 系列教程的首个分享。下一篇,我们会更详细深入探究机器学习的过程,通过一个公式一步一步剖析怎样解决机器学习问题。

阅读原文,在线上社区论坛留下你的反馈。