专栏名称: 雷峰网
中国智能硬件第一媒体
目录
相关文章推荐
ZOL中关村在线  ·  剑走偏锋的iPhone 17 ... ·  2 天前  
新浪科技  ·  #基金经理会爱上自己投资的股票# ... ·  2 天前  
新浪科技  ·  【#中国电动汽车占全球总销量近70%#】# ... ·  3 天前  
EETOP  ·  马斯克身价突破4000亿美元! ·  5 天前  
51好读  ›  专栏  ›  雷峰网

从世界冠军到数据科学家 他在挖什么?

雷峰网  · 公众号  · 科技媒体 硬件  · 2016-09-01 08:20

正文

数据挖掘的英文叫Data Mining,Mine有“矿”的意思。因此做数据挖掘的学者们常常戏称自己为“矿工”。不过,其实数据挖掘的研究过程与采矿确实有异曲同工之妙。数据的收集、筛选、分析和应用,正如矿石的勘探、开采、提纯和使用一样,每个步骤都看起来都是大海捞针,但在合适的方法下,这些“针”又每次都能被恰如其分的挖掘出来。


大数据这个词我们听得太多了,可是很少有人意识到,随着互联网的发展,今时今日的这些“大”字究竟已经意味着一种什么样的量级。除去少数哗众取宠的使用这个词的公司外,那些真正拥有大数据的企业,经手和处理的都是一些普通人可能穷极一生也接触不到的数字:微信朋友圈每天会上传10亿张图片,支付宝日交易额峰值超过200亿元人民币,京东每天上传几百万张新的商品信息图……


这些数字对于急需数据训练的人工智能算法来说是莫大的好消息。也意味着数据对于人工智能的重要性正在随着计算能力、算法的发展而呈直线上升。但是怎么在浩如烟海的数据中筛选出对我们真正有用的那些?又如何通过分析这些数据做出对自身有利的决策?这就是数据科学家们做的事了。



本期硬创公开课,我们邀请到了iPin的首席科学家潘嵘,他曾获得2005年全球最高级别数据挖掘大赛KDDCUP的世界冠军,也在科研和产业领域都积累了相当丰富的经验,本周四下午3点,就让潘嵘老师来为我们讲讲,一个合格的数据科学家是怎样炼成的。