专栏名称: 大数据文摘
普及数据思维,传播数据文化
目录
相关文章推荐
数据派THU  ·  清华软件论坛 | 樊文飞:AI = ... ·  昨天  
数据派THU  ·  征文延期至11月22日通知 | ... ·  5 天前  
CDA数据分析师  ·  【抄作业】“双11”复盘汇报如何分析数据? ... ·  6 天前  
51好读  ›  专栏  ›  大数据文摘

谷歌宣布收购全球最大数据科学社区Kaggle

大数据文摘  · 公众号  · 大数据  · 2017-03-09 09:42

正文

大数据文摘作品,转载要求见文末

编译 | 姜范波,任杰,Sophie


-------------------

【数据科学实训营】开课在即,

小班手把手实战辅导,

云平台7*24小时练习,

掌握数据科学家必备技能。

报名优惠最后一天,

详情见文末。

------------------


Google于今早在旧金山举行的Google Cloud Next会议上确认将收购数据科学竞赛平台Kaggle,但没有公开收购条款细节。

图:2017年3月9日Kaggle社区最新排名

这项收购并不出人意料。Kaggle在平台上拥有50万数据科学家,它将使Google能够立即在AI社区中拓展其覆盖范围。随着谷歌与亚马逊在云计算领域的竞争难分伯仲,它将需要尽可能多的制胜点。

这也将帮助谷歌在数据科学社区中更加扎实地确立其品牌——尽管得益于其像TensorFlow这样的项目,它已经是主角之一。谷歌面临着日益激烈的竞争,因为人工智能领域已经向自动驾驶和深度学习等垂直领域发展,公司不论大小都可以分到一杯羹。这从理论上可以将谷歌排除在最佳人工智能操作公司名单之外,虽然谷歌旗下的阿尔法狗刚刚战胜围棋世界冠军。

购买Kaggle及其在人工智能社区内的知名度也可能有助于招聘。Google需要确保它不断吸收专门从事深度学习的最佳人才,与其他公司(例如Pinterest(专注于视觉搜索))竞争。即使并不是一个比较专业化的技术收购,收购也意味着谷歌正在扩大关注范围,以探索更深入不同类别的方法,以确保其在人工智能的主导地位。

据估计,Google会保证Kaggle继续运营其服务—并保留其当前名称。

Kaggle由Goldbloom和Ben Hamner于2010年创立。企业和研究人员在Kaggle上发布数据,让全世界的统计师和数据科学家对数据集进行建模和分析,以竞赛的形式评选出最佳模型。Kaggle的众包竞赛模式的价值在于,让人们有可能从无穷无尽的建模方法中,寻找到最优解。作为一个举办数据科学和机器学习竞赛的平台,尽管早期有一些竞争对手,如DrivenData,TopCoder和HackerRank,Kaggle已经通过特别的市场定位,将它们远远甩在后面。它已经是数据科学和机器学习竞赛领域当之无愧的大哥大。

Kaggle也有一些与谷歌的“历史渊源”,就在本月初,Google和Kaggle合作举办了一场价值100,000美元的机器学习竞赛,围绕YouTube视频进行分类。这场比赛也与Google Cloud Platform进行了深入的整合。

虽然谷歌的收购主要基于Kaggle所构建的社区、而不是其技术价值,Kaggle自身也针对数据科学竞赛开发了不少有用的工具。数据科学家可以使用一个基于云的平台Kaggle Kernels(曾经被称为Scripts)运行数据分析和建模的代码、将源代码分享给他人以得到社区中的反馈意见,以及将源代码展示在自己的Kaggle资料中。这样,企业将非常容易看到Kaggle竞赛中排名靠前的选手所做过的工作,这也是数据工作者竞相争取更高Kaggle排名的原因(当然,另一个原因是企业为最佳数据分析结果给出的巨额奖金!)。

Kaggle的另一项服务是其网站上的招聘信息发布。目前还不知道谷歌将如何处理这项业务。

图:Kaggle招聘服务


根据Crunchbase,Kaggle从2010年推出以来,筹集了1250万美元(PitchBook说是1275万美元)。Kaggle的投资者包括Index Ventures,SV Angel,Max Levchin,Naval Ravikant,Google首席经济学家Hal Varian,Khosla Ventures和Yuri Milner。

以下为Kaggle的 CEO,Anthony Goldbloom的演讲内容:

我很自豪和兴奋地宣布,Kaggle准备加入谷歌云!

七年前,我们发起了第一场竞赛,以预测欧洲歌唱大赛的投票模式。Jure Zbontar赢了,他击败其它的21支队伍,赢得1000美元的奖金。

从那以来,Kaggle社区已经使用机器学习来为高中作文打分,诊断心力衰竭和提高希格斯玻色子发现的显著性。 Geoff Hinton和George Dahl在默克竞争中展示了深层神经网络的力量,Tianqi Chen使用Kaggle Kernels向XGBoost介绍了社区。 Kaggle的个人资料库已经成为一项公认的认证证明,社区成员在这里完成从DeepMind到沃尔玛公司的工作。去年8月,我们推出了一个开放的数据平台,社区已经共享了数百个高质量的数据集。在Kaggle社区,我们已经一起取得了很多重要进展!

Kaggle的团队将作为一个整体加入Google Cloud,并将保留Kaggle的独特品牌。我们将继续发展我们的竞赛和开放数据平台,继续对所有数据科学家、公司、方法和技术开放。 Kaggle Kernels将继续支持源自Google多样化生态系统的机器学习库和包,也会继续支持那些并非源自Google的工具包。

Kaggle加入Google将允许我们实现更多目标。它将世界上最大的数据科学社区与世界上最强大的机器学习云相结合。更令人振奋的是,这还能联合ImageNet创作者李飞飞和李佳的力量。

将Google云技术接入我们的社区后,我们将能够接入强大的基础架构、可扩展的培训和部署服务,以及存储和查询大型数据集的能力。

感谢所有人为建立我们超级棒的社区所付出的努力。我无比期待接下来能和你们一起实现更多。

——Anthony Goldbloom, CEO


2014年,Python成为在美国顶尖计算机科学项目里最为流行的教学语言。

来参加数据科学实训营,用Python系统学习数据科学!戳阅读原文了解更多)

寒小阳、加号、常老师3位资深讲师,

3位班主任与10+助教,

使用7*24小时云实验平台,

大型互联网公司真实案例,

14次直播教学 + 17次小班手把手实战辅导

——3月18日开课,今天报名优惠最后一天!

👇长按图片识别二维码,获取课程详情并报名

课程咨询——

请联系客服牛妞微信shujupeixun,

电话15510583388


来源:

https://techcrunch.com/2017/03/07/google-is-acquiring-data-science-community-kaggle/
https://techcrunch.com/2017/03/08/google-confirms-its-acquisition-of-data-science-community-kaggle/

http://blog.kaggle.com/2017/03/08/kaggle-joins-google-cloud/



关于转载
如需转载,请在开篇显著位置注明作者和出处(转自:大数据文摘 | bigdatadigest),并在文章结尾放置大数据文摘醒目二维码。无原创标识文章请按照转载要求编辑,可直接转载,转载后请将转载链接发送给我们;有原创标识文章,请发送【文章名称-待授权公众号名称及ID】给我们申请白名单授权。未经许可的转载以及改编者,我们将依法追究其法律责任。联系邮箱:[email protected]

志愿者介绍

回复“志愿者”了解如何加入我们







往期精彩文章


点击图片阅读文章

辨别真假数据科学家必备手册:深度学习45个基础问题(附答案)