专栏名称: 两个质子
我们是谁?我们从哪里来?我们到哪里去?一群为科学着迷的普通人,一群为生活着迷的科学家。我们就是两个质子。
51好读  ›  专栏  ›  两个质子

机器学习改变互联网,物理学家将重新定义硅谷

两个质子  · 公众号  · 科学  · 2017-04-01 12:01

正文

对于物理学家来说,这并不是一个好时代。


奥斯卡·博伊金


至少对于奥斯卡·博伊金来说是这样的。这位2002年毕业于美国加州大学洛杉矶分校的物理学博士,四年前,他所在的瑞士大型强子对撞机项目发现了被称为“上帝粒子”的希格斯玻色子,这种粒子是粒子物理学“标准模型”理论中最后一种未被发现的亚原子粒子,早在20世纪60年代就有人预测这种粒子的存在,物理学家也一直致力于证明它的存在。


位于瑞士的大型强子对撞机


正如博伊金所指出的,每个人都期望它的发现,然而希格斯玻色子并没有颠覆传统的宇宙理论模型。它没有改变任何东西,或给予物理学家任何新的研究方向。“物理学家总是兴奋于找到当前物理学中的一些问题,但是现在很可惜,我们并没有发现有什么不对的地方。当物理学家来到这里,带给他们的只有沮丧和失望,况且这里的工资也不高。”博伊金说


强子对撞实验中的希格斯衰减信号


现在,博伊金已不再是名物理学家,而是一名硅谷的软件工程师,这对于他来说也许才是最好的选择。


博伊金目前就职于Stripe,这是一家价值90亿美元的创业公司,帮助企业完成在线支付业务。他帮助构建和运行公司数据收集服务的软件系统,并致力于预测这些服务的下一步发展动态,这里面就包括预测欺诈性交易会何时,何地以及如何发生。


作为物理学家,他非常适合这项工作,因为这需要极为优秀的数学和抽象思维。不过,又和其他还在做理论研究的物理学家不同的是,他所在的这个领域,将给他提供无穷的挑战和可能性。此外,这里的薪水也是高得惊人。


Stripe凭借着其优惠的服务费用迅速占领美国支付市场,并与支付宝开展合作


如果把物理学和软件工程都比作成亚原子粒子,那么硅谷已经变成了这些粒子碰撞的地方。目前,已有三位其他物理学家与博伊金一起在Stripe工作。去年12月,当通用电气收购了机器学习创业公司Wise.io时,通用首席执行官杰夫·伊梅尔特就曾吹嘘他刚刚抓住了一家专门包装物理学家的公司。在该公司中,最著名的莫过于加州大学伯克利天体物理学家约书亚·布卢姆。他同来自瑞士的物理学家阿诺·坎德尔一同开发的开源机器学习软件H2O,全球数据科学家的用户数量已高达7万名。此外,微软的数据科学主管维贾伊也是一名天体物理学家,而且在他手下也有其他好几名物理学家和他共事。

 

确切地来说,这一切其实并不是有意为之。Stripe总裁兼联合创始人约翰·科里森说:“我们没有去物理幼儿园,偷了一篮子儿童。这只是顺其自然的事情。它之所以发生在硅谷。是因为在结构和技术上,每个互联网公司需要做的事情越来越需要物理学家的技能。”

 


什么是计算机科学的本质?

 

当然,物理学家完全可以称得上是在计算机技术的开山鼻祖,并在早期的计算机技术方面发挥了基础性作用。帮助设计世界上最早的计算机之一ENIAC的约翰·莫克里就是名物理学家。此外,有“C语言之父”之称的尼斯·里奇曾经也是一位物理学家。


世界上最早的计算机之一:ENIAC


C语言之父丹尼斯·里奇


现如今,尤其是这几年,对于从事计算机技术研究的物理学家来说,是一个特别成熟的时机。由于机器学习的兴起,机器通过分析大量数据来学习任务。这种新的数据科学和人工智能技术对于物理学家来说简直是太适合不过了。

 

除此之外,神经网络技术现如今也已被业界广泛接受,该技术旨在模仿人类大脑结构,从而对输入数据进行分析和判断。但这些神经网络规模巨大,并且主要依赖于线性代数和概率论等数学基础。这些对于计算机科学家来说,也许并不是他们的强项,但物理学家却可以应付自如。“对于物理学家而言,真正令他们感到新鲜的事情就是学习如何优化这些神经网络,并且训练它们,”博伊金说“在神经网络算法中,有一种算法叫‘牛顿法’,这里的牛顿正是家喻户晓的物理学家牛顿,而不是其他牛顿。”

 

同样,来自微软的剑桥研究实验室主管克里斯·毕绍普早在三十年前感受到了这种趋势,那时深层神经网络技术刚刚开始在学术界崭露头角,他便从物理学转行投身于机器学习的研究。他说:“物理学家进入机器学习领域是一件非常自然的事情,这甚至比计算机科学家来研究它更自然。

 


挑战空间

 

博伊金说,十年前,他的许多物理学界朋友纷纷涌入金融行业。并用其数学能力作为预测市场走向的一种方式,在华尔街赚的盆满钵满。这其中一个非常关键的方法就是布莱克-舒尔斯方程,这是一种确定金融衍生物价值的方法。但同样,也正是布莱克-舒尔斯方程帮助酿造了2008年的金融危机。现在,博伊金和其他物理学家说,更多的同事正在进入数据科学和计算机技术等领域。


金融界经典的布莱克-舒尔斯方程


在这十年初,物理学家纷纷来到顶尖的科技公司,帮助建立所谓的大数据软件,这些系统在数百甚至数千台机器上拼接数据并对其进行分析。在社交网站公司Twitter,博伊金帮助他们搭建了一个名为Summingbird的大数据分析软件。同样,在麻省理工学院物理系的三名物理学家在一家名为Cloudant的初创公司也建立了类似的软件。在麻省理工学院,这些物理学家就经常处理来自大型强子对撞机产生的海量数据。确实,物理学家更擅长处理数据,因为构建这些非常复杂的系统需要极为强大的抽象思维

 

在早期的Google里,负责构建大规模分布式系统的关键人物之一约纳坦·曾格,他拥有斯坦福大学的弦理论博士学位。谷歌前搜索和广告工程部经理凯文·斯科特刚加入Google的广告业务部门时,他负责从Google各处获取数据,并使用这些数据来预测哪些广告最有可能获得最多的点击次数,他曾聘请了大量物理学家。“与计算机科学家不同的是,机器学习技术的需要大量实验的这一特征更加适合物理学家,这几乎就是一门实验室科学”现任LinkedIn首席技术官的斯科特说。

 

如今,大数据已经成为科学界常谈的话题,其处理软件也是遍地开花。Stripe使用的是博伊金在Twitter帮助其构建的开源版本,它的机器学习模型帮助并推动许多其他公司发展。而这也为物理学家进入硅谷提供了更广阔的道路。在Stripe,博伊金与罗本·克雷默(物理学博士,哥伦比亚大学),克里斯汀·安德森(物理硕士,哈佛)和团队领导凯利·里瓦尔(物理学学士,麻省理工学院)一起工作。他们之所以来到这里,一方面是因为这里有合适的工作。但也同样是为了钱。正如博伊金所说:“也许对于科学家来说,谈钱并不是一件光彩的事情,但是他们还是来了,因为有很多困难的问题需要解决。”

 

安德森在获得博士学位之前就离开了哈佛,因为他像博伊金有着同样的眼光,那就是意识到在自己专业领域正在做一种回报递减的知识追求。“这是一个可以无限延伸的领域,这里的机会更多,同样也有着更大的挑战空间,问题空间和智力上升空间。”安德森说。

 


关于未来


如今,越来越多的物理学家来到硅谷。未来几年,这一现象也许会进一步蔓延。机器学习不仅改变世界如何分析数据,也改变着软件的构建方式。神经网络已经重塑了图像识别,语音识别,机器翻译以及软件接口的本质。正如微软的克里斯·毕绍普所说,软件工程正在从基于逻辑的手工编码转向基于概率和不确定性的机器学习模型。像Google和Facebook这样的公司,也开始用这种新的思维方式重新训练他们的工程师。毫无疑问,最终整个计算机世界将紧跟这一潮流发展。

 

换句话说,与其说物理学家正在进入硅谷工程师的领域,不说是所有的硅谷工程师在未来都将进入物理学家的领域。