专栏名称: 算法与数学之美

从生活中挖掘数学之美，在实践中体验算法之奇，魅力旅程，从此开始！

当今世界最NB的25位大数据科学家

算法与数学之美 · 公众号 · 算法 · 2016-12-01 22:39

正文

作者：一只鸟的天空

来源：http://blog.csdn.net/heyongluoyao8/article/details/48598169

引言

在大数据技术飞速发展的今天，谁才是我们大数据科研与工业界中最有威望的科学家呢？下面我们来进行梳理，共罗列了25位当今世界，无论是在学术与工业界都产生巨大影响的数据科学家（Data Scientists）。他（她）们推动了整个领域的发展，毫无疑问，无论是在学术界还是还工业界，他（她）们都是一座座山头式的人物。他（她）们是我们这些从事大数据产业发展的榜样。他（她）们便是所谓的大师级人物。
数以万计的数据从业者通过他（她）们的论文、博客、视频、讲义等进行学习与进步，并找到相应的应用场景解决方案。这些大师为人们解开了统计机器学习、神经网络以及深度学习的神秘。
下面从三个类别对这25位大师进行简介，虽然这个分类可能并不那么恰当，但是可以加深读者对他（她）们的了解。

科研学术界大师(Research Oriented Data Scientists)
这些科学家全身心致力于在数据中发明新的算法或者模型，他（她）们更倾向于学术与科研界的创新与创造。
工业界应用大师(Data Scientists Turned Entrepreneurs)
这些科学家致力于将技术转变为生产力，应用数据技术去创造产品和服务。
实践中的大师(Data Scientists in Action)
显然，并不是说上面两类大师不是实践派。只是为了强调这类大师将数据科学引入到实践当中所作的贡献。

为了便于大家去全面深入得了解和学习这些数据大拿，本文所列举的每个大拿都有其链接(LinkedIn/Twitter).

Research Oriented Data Scientists

Geoffrey Hinton

只要是在机器学习届混的或者懂点机器学习的人们，抑或懂点神经网络的人们，相信都知道“Back Propagation“反向传播的鼎鼎大名。Hinton便是将BP算法应用到神经网络与深度学习中人员之一，并且是主导者(co-inventor). Hinton 提出了“Dark Knowledge”黑暗知识概念(“Dark Knowledge”这本书籍已经出版，亚马逊上面有卖，288RMB，可见其nb性)，该概念是受小概率比率事件中的“大部分知识”对于训练与测试中的代价函数是没有影响的。Hinton在人工智能领域中无人不知无人不晓是因为其在人工神经网络(Artificial Neural Networks)中所作出的贡献。
早在上世纪60年代，Hinton在高中时期，就有一个朋友告诉他，人脑的工作原理就想全息图一样。创建一个3D全息图，需要大量的记录入射光被物体多次反射的结果，然后将这些信息存储在一个庞大的数据库中。大脑存储信息的方式与全息图类似，大脑并非将记忆存储在一个特定的地方，而是砸整个神经网络里传播。从此，Hinton对神经网络深深得着迷。他在剑桥大学学习心理学期间，发现科学家们并没有真正理解人类大脑，人类大脑有数十亿个神经细胞，它们之间通过神经突触互相影响，形成极其复杂的相互联系，然而科学家们并不能解释这些具体的影响和联系。神经到底是如何进行学习以及计算的，对于Hinton，这些正是他所关心的问题。Hinton在爱丁堡大学获得了人工智能的博士学位，现为多伦多大学的特聘教授。在2012年获得了加拿大2012年基廉奖（Killam Prizes，Killam Prizes是有“加拿大诺贝尔奖”之称的国家最高科学奖）。在2013年，他加入Google，并带领一个AI团队，目前正进行着Google Brain项目。
他和他的团队强力将“神经网络”从垂死边缘一步步带入到当今的研究与应用的热潮，变成了炙手可热的的学术界课题，将“深度学习”从边缘课题变成了Google等互联网巨头仰赖的核心技术。目前神经网络与深度学习已在自然语言处理、语音处理以及计算机视觉等领域中得到了空前广泛与成功地应用。越来越多的科学家从事神经网络与深度学习的研究工作。换句话说，深度学习是目前的主流，我们不再是极端分子了。

Yann Lecun

Lecun在多伦多大学随Hinton读博士后，即他是Hinton的学生。他是另一个神经网络与深度学习大拿。他在皮埃尔玛丽居里大学（又称巴黎第六大学， Université Pierre et Marie Curie (Paris VI)）获得了计算机科学博士学位，期间提出后向传播算法。他如今在Facebook带领团队进行人工智能工作，即他是Facebook人工智能实验室的负责人。他在纽约大学任职了12年，是纽约大学的终身教授，是纽约大学数据科学中心的负责人。为了表彰他在深度学习领域里所作出的贡献，IEEE计算机学会颁给他著名的“神经网络先锋奖”，在2014年北京计算智能大会上授予。在加盟Facebook之前，Lecun已在贝尔实验室工作超过20年，期间他开发了一套能够识别手写数字的系统，叫作LeNet，用到了卷积神经网络(Cnvolutional Neural Networks, CNN)，已开源。他研发了很多关于深度学习的项目，并且拥有14项相关的美国专利。他甚至开发了一种开源的面向对象编程语言Lush，比Matlab功能还要强大，并且也是一位Lisp高手。他在机器学习、深度学习、计算机视觉、计算神经科学领域进行了深度研究。

Yoshua Bengio

Bengio是另外一位机器学习、深度学习的大拿。他在麦吉尔大学获得博士学位。他是ApSTAT技术的发起人与研发大牛。他也是蒙特利尔大学(Université de Montréal)的终身教授，任教超过22年，是机器学习实验室(MILA)的负责人，是CIFAR项目的负责人之一，负责神经计算和自适应感知器等方面。又是加拿大统计学习算法学会的主席，并且是NSERC-Ubisoft主席以及其它。在蒙特利尔大学任教之前，他是AT&T & MIT的一名机器学习研究员。他的主要贡献在于深度学习与人工智能等领域。

Jurgen Schmidhuber

他致力于构建一个自完善的人工智能机器。他曾任职于南加州大学，现任于卡内基梅隆大学语言技术研究所。他是著名的自然语言处理学者与专家，是国际计算语言协会（ACL）的首批Fellow，曾任ACL2001年主席。他主要的研究工作是机器学习、RNN（Recurrent Neural Networks，循环神经网络）、深度学习、计算机视觉以及自然语言处理等。他早机器翻译、自动文摘、自动问答、文本理解等领域作出了杰出的贡献。他自述目前自己最感兴趣的两个方向是语言计算机理解：计算机对一篇整体的文本而不是对一个个句子进行孤立的理解，这中间需要进行指代消解、实体解析和实体链接等很多工作。另一个是社会媒体，他目的并不是研究连接网络的拓扑结构，而是研究流经网络的海量的实时化的内容，从而发现人的性格、角色和特长等。他的研究已广泛应用于Google、Microsoft、IBM、Baidu、Facebook、Twitter等公司，特别是在循环神经网络中作出的贡献，如广泛使用的LSTM(Long Short-Term Memory，长短时记忆)与最新的据说胜过LSTM的CW-RNN(Clockwork RNN，时钟驱动循环神经网络)。他已经发表了333篇论文，有7篇最佳论文。获得了2013年国际神经网络社会（International Neural Networks Society）的Helmholtz奖（亥姆霍兹奖），并获得2016年该会议的先锋奖。

Alex “Sandy” Pentland

在过去的29年时间中，Perntland都任职于MIT(麻省理工大学)的教授。在这期间，他创建多个公司，如IDcubed.org、Sense Networks、Cogito Health、 Ginger.io等。根据他所取得的成就，福布斯（Forbes）称他是世界上最有力量的数据科学家（the ‘World’s Most Powerful Data Scientist’ ）。他也被任命为多个跨国公司(MNCs)的顾问(an advisor)，如Nissan、Motorola、HBR、Telefonica等。他的主要兴趣在机器学习、人工智能与人类计算(Human computing)等领域。

Peter Norvig

Norvig目前任职于Google。在此之前，他在NASA工作了六年，担任计算科学部门的负责人，期间获得了NASA杰出贡献奖(Exceptional Achievement Award)。是ACM、AAAI等的Fellow。他在加利福尼亚大学伯克利分校（University of California, Berkeley）获得了计算机科学博士学位。他的兴趣在于人工智能（AI），自然语言处理（NLP）和机器学习等领域。

Corinna Cortes

Cortes目前是google的研究员。她在哥本哈根大学（University of Copenhagen）获得物理学理学硕士，并加入贝尔实验室（AT&T Bell Labs），在此工作超过十年。并在罗切斯特大学（University of Rochester）获得了计算机科学博士学位。她的研究主要在人工智能、机器学习、自然科学通论、算法与理论等方面。并且她是一位拥有两个孩子的妈，可谓是人生赢家。

Micheal I Jordan

Jordan是加利福尼亚大学伯克利分校电子工程系和计算科学系陈丕宏（Pehong Chen）特聘教授（Distinguished Professor）和（UC Berkeley）统计学系的特聘教授。他近些年的研究工作主要集中在无参数贝叶斯分析、概率图模型、谱方法、核方法以及信号处理中的应用等方面。其中，他便是聚类算法中广泛使用的基于规范切（Normalized cut）谱聚类算法提出者之一。他获得了多个举足轻重的奖项，如数理统计学会（Institute of Mathematical Statistics ，IMS）授予的Neyman Lecturer 和Medallion Lecturer。他获得了加利福尼亚大学伯克利分校的认知科学博士学位，并且是麻省理工大学（MIT）的教授。

Data Scientists Turned Entrepreneur

Andrew Ng

Andrew Ng中文名为吴恩达，他和Daphne Koller共同创建Coursera（在线教育平台）这一流大学在线课程平台。他2014年5月16日加盟百度，成为百度首席科学家，带领百度大脑计划项目，负责百度研究院，开展深度学习和大数据与人工智能可伸缩性方法。他又是斯坦福大学（Stanford University）的计算机科学系与电子工程系的副教授，人工智能实验室主任。他于1997年获得了卡内基梅隆大学（CMU）的计算机科学学士学位，1998年获得了麻省理工大学（MIT）硕士学位，并于2002年获得加州大学（加利福尼亚大学的简称）伯克利分校（UC Berkeley）的博士学位，并从这一年开始在斯坦福大学任教。
在加盟百度之前，他已经在google工作了几年，在XLab团队开发无人驾驶汽车和谷歌眼镜等项目，并与其他google工程师合作建立了全球最大的人工神经网络，名为Google Brain（Baidu Brain就是模仿它），对于普通数据从业者最熟悉的莫过于斯坦福大学机器学习公开课（该课是多少机器学习从业者入门的课程，其中我也是）以及使用利用团队所开发的人工神经网络通过观看一周YouTube视频，自主学习与自动识别哪些是关于猫的视频。他是人工智能和机器学习领域国际上最权威的学者之一。他2007年获得了斯隆奖（Sloan Fellowship），2008年入选“the MIT Technology Review TR35”，即《麻省理工科技创业》杂志评选出的科技创新35俊杰，以及计算机思维奖（Computers and Thought Award），并在2013年入选《Time》杂志年度全球最有影响力的100人之一，共16位科技界人物。他的主要兴趣领域在机器学习、深度学习、机器人、人工智能、计算机视觉等方面。
ps：为啥看起来像亚洲人，因为他父亲是一名香港医生，即他是华裔。

Daphne Koller

Koller也是在线教育平台Coursera的负责人和共同发起人之一。她在耶路撒冷希伯来大学（The Hebrew University of Jerusalem）攻读学术与硕士学位，在斯坦福大学获得计算机科学博士学位，在加州大学伯克利分校攻读博士后。现为斯坦福大学教授。在攻读博士期间，获得了很多奖项，如杰出青年科学家奖（ONR Young Investigator Award）、ACM Infosys 基金（ACM Infosys由Infosys公司创立于2007年8月。旨在奖励在计算机科学界做出杰出贡献并有深远影响的人才）、2001IJCAI计算机和思维奖（Computers and Thought Award）、麦克阿瑟奖（MacArthur Foundatin Fellowship，俗称“天才奖”，被视为美国跨领域最高奖项之一）。她已在斯坦福大学任职了18年。她的主要兴趣领域是机器学习、人工智能与模式识别等。

Hilary Mason

Mason是快速前进实验室（Fast Forward Labs）的发起人，也是hackNY.org与DataGotham的联合创始人。在此之前，她在Bitly担任首席科学家，和强生威尔士大学(Johnson & Wales University)的助理教授。她在2011年进入Fortune（财富杂志）评出的40岁之下的财富前40（Fortune 40 under 40）与克雷格财富40周岁前40（Craig’s 40 under Fort），并获得2012年TechFellow Engineering Leadership Award。她的主要兴趣领域在机器学习、数据挖掘与 Python 。

Sebastian Thrun

Thrun是Udacity的创始人与CEO。在此之前，他创建了 Google X （Google X秘密实验室是Google最神秘的一个部门，探索前沿科学技术与未来，这里汇聚了其它高科技公司、各大高校和科研院所挖过来的顶级专家，可能是梦想实现之地，但是也有可能会失败）并作为副总裁（Vice President，VP）在Google工作了7年，并在斯坦福大学担任研究教授（Research Professor）。他旨在大众化教育，让每个人都有机会学习世界各地的课程。他的梦想是让世界上每个人接受到更好的教育是这个世界更加美好。他的主要研究领域是机器学习与人工智能。

当今世界最NB的25位大数据科学家

正文

作者： (adsbygoogle = window.adsbygoogle || []).push({}); 一只鸟的天空

引言

Research Oriented Data Scientists

Data Scientists Turned Entrepreneur

请到「今天看啥」查看全文

作者：一只鸟的天空