专栏名称: 雷峰网
中国智能硬件第一媒体
目录
51好读  ›  专栏  ›  雷峰网

谷歌收购 Kaggle 为什么会震动三界(AI、机器学习、数据科学界)?

雷峰网  · 公众号  · 科技媒体  · 2017-03-09 17:54

正文


在昨晚的 Google Cloud Next 谷歌 云计算 开发者大会上,华人 AI 学界的骄傲、谷歌云首席科学家李飞飞宣布了一则重大消息:谷歌收购 Kaggle。

其实,关于这事儿,近两天陆续有风声传出。但谷歌和 Kaggle 对各路媒体总是一副 “无可奉告” 的态度,导致大家各自猜测,但无从证实。即便是李飞飞在 Next 大会上对全世界进行宣布,也仅仅停留在 “没错,我们是收购了 Kaggle,这事儿对双方都有好处” 的层面;对收购细节、未来计划等信息一概无涉,更不要提收购协议和价格。

但是,Google+Kaggle,即便不进行任何发酵,也是震动数据科学、AI、机器学习三界(好吧,在很多方面 “三界” 本是一体)的大事件。其衍生出来的潜藏信息:对开发者社区的意义、行业走向,以及谷歌的机器学习布局等——虽然当事者惜字如金,却为嗅觉敏锐的观察者带来巨大的想象空间。这隐约使人联想起 2014 年谷歌对 DeepMind 的收购:虽则后者与 Kaggle 不管在业务、还是运营方式上都完全不同,但 Kaggle 所掌握的行业资源,只在 DeepMind 之上;两次收购对于谷歌的意义,同样位于极高的战略层面。

李飞飞宣布谷歌云收购 Kaggle

下面我们来整理一遍,关于此次收购迄今为止披露的所有信息。

Kaggle 简介

凡是玩数据科学和机器学习的老司机,有两个网站一定不会错过:GitHub 和 Kaggle。前者用来分享,后者进行实战练习。对于不熟悉 Kaggle 的童鞋,我们先来进行一段简介。

简而言之,Kaggle 是玩数据、ML 的开发者们展示功力、扬名立万的江湖。

它在 2010 创立,专注于举办数据科学周边的线上竞赛。它吸引了大量数据科学家、机器学习开发者的参与,为各类现实中的商业难题开发基于数据的算法解决方案。竞赛的获胜者、领先者,在收获对方公司提供的优厚报酬之外,还将引起业内科技巨头的注意,获得各路 HR 青睐,为自己的职业道路铺上红地毯。

因此,与 GitHub 不同的地方在于,Kaggle 为其社区提供了一整套服务。其中最有名的是它的招聘服务以及名为 Kaggle Kernels 的代码分享工具。

或许因为如此,Kaggle 社区在圈内极受欢迎:用户基数大、粘性强。通常认为 Kaggle 平台有几十万数据科学家。至于具体多少,有媒体认为是五十万,有人说八十万(李飞飞),还有人说超过一百万。

总而言之, Kaggle 是当今最大的数据科学家、机器学习开发者社区,其行业地位独一无二。

而大约一年前,Kaggle 开始全力在 AI、机器学习领域发力,相关竞赛项目纷纷上马。李飞飞评论道:

“Kaggle 是搜寻、分析公共数据集,开发机器学习模型,和提高数据科学专业水平的最佳场所。”

“AI 民主化” 的使命

在大会上,李飞飞发表了主题为 “让 AI 民主化” 的演讲。在此次演讲和之后撰写的博文里,她对谷歌收购 Kaggle 的意图给出了官方版本的解释:

“我强调 AI 民主化的重要性——我们必须降低进入 AI 领域的门槛,让 AI 技术能为尽可能多的开发者社群、用户和企业所用,让 AI 被用于解决他们各自的问题和需求。Kaggle 加入谷歌,能加速这一进程。”

冠冕一些来讲,推动 AI 技术的分享和推广,是谷歌收购 Kaggle 背后的 “mission”,即使命。

加入谷歌之后的 Kaggle

虽然谷歌对收购协议的内容进行保密,我们仍能从双方已透露的信息看出一些端倪。比如,有一件事是确定无疑的: Kaggle 将保留独立品牌和团队。

Kaggle 创始人 Anthony Goldbloom 也在昨晚发表博文,回顾 Kaggle 创立以来取得的成绩,对支持 Kaggle 社区的开发者表示感谢,并透露了一些将来的计划:

“ Kaggle 团队仍会是一个整体,并将作为谷歌云旗下的独立品牌运营。我们会继续扩展 Kaggle  上的竞赛和开源数据平台;并且我们会继续对所有的数据科学家、公司、和技术敞开怀抱。Kaggle Kernels 会继续对各类机器学习库和工具包组成的多样生态进行支持,不管其是否来自谷歌。

加入谷歌能让我们实现更多。此次收购,把世界上最大的数据科学社区与最先进的机器学习云结合到了一起。

加入谷歌后, 我们能够向社区提供谷歌云技术。 这将使大家能利用更强大的基础设施和部署服务(deployment services),进行可扩展的训练,并且帮助 Kaggle 拥有存储、获取大型数据集的能力。”

Anthony Goldbloom(图片与本新闻无关)

李飞飞在大会和博客上的表态,虽没有 Anthony Goldbloom 详细,但也印证了一些 Anthony Goldbloom 提到的一些要点。比如,飞飞老师说谷歌云将为 Kaggle 社区成员提供云机器学习开发环境,Kaggle 和谷歌云将继续支持训练和部署服务,并帮助社区存储、获取大型数据集。

结合飞飞老师对 “AI 民主化” 的表态,以及在大会上回溯她亲手创建的 ImageNet、对数据库重要性进行的强调;雷锋网认为,我们应当可以期待谷歌云在数据上为 Kaggle 提供强力支持,帮助 Kaggle 社区的开发者获取更多、更有价值的数据集。而这确实击中了数据科学家和机器学习开发者的一大痛点。这无疑也将直接提升谷歌对数据科学、机器学习社区的影响力,以及在其中的口碑和品牌认同。

收购 Kaggle 之后的谷歌

谷歌的核心业务与 AI 紧密相关,也已经成为推动这一轮 AI 技术浪潮的主要玩家之一。AI、数据科学和机器学习对于谷歌的战略意义,已毋庸赘言。自从去年 AlphaGo 与李世石的世纪之战,谷歌的江湖声望更是如日中天。

但是,在 AI 应用和技术的各个垂直领域,如 自动驾驶







请到「今天看啥」查看全文