专栏名称: 半导体行业观察
半导体行业第一垂直媒体,30万半导体精英的共同关注!实时、专业、原创,专注观察全球半导体行业最新资讯、技术前沿、发展趋势。欢迎订阅摩尔精英旗下更多公众号:摩尔精英MooreRen、摩尔芯闻MooreNEWS
目录
相关文章推荐
半导体行业联盟  ·  董明珠:做心片没有拿国家一分钱!全产业链已完 ... ·  3 天前  
21ic电子网  ·  NXP 突然收购Aviva ... ·  3 天前  
OFweek维科网  ·  侵权格力赔了50万?小米总经理回怼! ·  4 天前  
半导体行业联盟  ·  美女董事长:卖掉50亿半导体公司! ·  4 天前  
半导体行业联盟  ·  上海张江!全球每4颗CIS芯片,就有1颗来自 ... ·  4 天前  
51好读  ›  专栏  ›  半导体行业观察

微软将未来押在这个FPGA芯片上

半导体行业观察  · 公众号  · 半导体  · 2016-09-27 09:10

正文


本文来自连线,由半导体行业观察根据原文翻译


将时钟回拨到2012年12月,Doug Burger站在当时的微软首席执行官 Steve Ballmer面前,与他畅谈未来。

 

以脾气暴躁闻名的SteveBallmer坐在Building 99演讲室的地板上,与四年前加入公司的计算机芯片研究员Doug Burger探讨一些芯片技术,这就是Burger口中的Project Catapult。



DougBurger.


Burger表示,技术世界正在跨进一个新的阶段。在未来,一些大型的互联网公司会运营一些跟以往不同的复杂互联网业务,而这些公司就需要打造一些全新的架构去运行这些业务,而这并不是通过软件去升级就可以实现的,当中还需要硬件去配合,当中就包括了服务器和网络设备。而Project Catapult就能解决微软的服务器问题,因为他们都会搭载微软特别定制的芯片,去完成这些特殊任务。

 

在Burger想向Ballmer介绍其最新的想法的时候,后者吃了一惊,因为他最初招聘Burger来微软,只是希望他能够升级研发中心,而不是来做策略介绍的,但Burger的表现出乎Ballmer的意料。Burger表示,再过去40年里,微软只是聚焦在打造Windows, Word和Excel这类的计算机软件,并不需要更多的硬件。而正是因为这样,微软避开了费事、昂贵且bug众多的硬件产业。而微软做硬件芯片就和可口可乐做鱼翅汤一样怪异。


ProjectCatapult


在演讲室里,Burger娓娓道来,他对Ballmer说,谷歌和亚马逊这样的公司已经开始做出转变,且现在的硬件制造商并不能提供满足微软在线服务所需的硬件服务。如果微软不再做硬件的话,未来一定会落后于其他竞争者,但Ballmer并不认同他的观点。然而一会之后,Bing的运营主管Qi Lu加入了讨论。他表示,他们的团队已经开始了相关的研究。


现在,这个由Berger和Lu打造的FPGA芯片,将会改变这个世界。其实FPGA已经被应用在Bing搜索的支持上,在接下来的数周内,微软将会基于神经网络(模仿人脑结构的人工智能)推动新的搜索算法。借助这个芯片,其执行速度比传统的芯片会快上很多倍,只需要24毫秒就可以实现,规避了以往长达四秒搜索空白的尴尬。

 

这个全新FPGA同样能够支持微软的云计算服务Azure。在接下来的数年里,微软全球的数百万部的服务器将会装上这个FPGA。“这个给我们带来了很大的灵活性和容量,并带来很大的经济收益”,Burger说。

 

“这将成为微软的标准,全球的架构”,Breger强调。



Catapult
团队成员:Adrian Caulfield,Eric Chung, Doug Burger,和Andrew Putnam


这个项目并不是为了帮助Bing追赶Google,这是对未来全球系统转变的一个信号。由于硅芯片的发展不能满足人工智能的需求,从美国的亚马逊到中国的百度,这些互联网都在其服务器上使用其相关标准的芯片。

 

从目前的情况看来,为了维持其网上业务运转,微软每年需要在硬件上投入50到60亿美元,因此关于这些芯片的追求要投入到实操阶段,2014年接任微软CEO的SatyaNadella对记者说。我们要将其提到优先位置,纳德拉强调。

 

一种全新的传统计算机芯片

 

2010年圣诞节前的某一天,微软的研究员AndrewPutnam正在度假,突然就接到他Boss Burger的电话。Burger告诉Putnam,节后他会和Bing的老大会面,因此他需要一个可以在FPGA上执行Bing的机器学习算法的硬件。

 

Putnam就立刻驱车前往最近的星巴克,打开电脑开始谋划这个项目。

 

47岁的Burger39岁的Putnam之前都是学者,Burger之前曾在德克萨斯大学奥斯汀分校担任了九年的计算机学教授,在那里,他专门研究微处理器,并设计了一款叫做EDGE的芯片;而Putnam则在华盛顿大学担任了五年的研究员,那五年里他一直和FPGA打交道。虽然FPGA存在了很长一段时间,但一直以来业内都是用它来做原型验证。2009年,BurgerPutnam招进微软,他们开始探索一个想法——这类FPGA芯片实际上可以加速在线服务。

 

这一想法,最初连他们的老板都不认同。 Burger小组的主管、微软的研究所VP Peter Lee说,每隔两年,FPGA的时代将要到来的论断,都会被炒热一次。但这次不一样了,Burger和他的研究小组坚信,FPGA大显身手的时代已经到来,而Bing则是最好的测试对象。


Project Catapult的第一个版本,Burger和他的团队在西雅图园区数据中心测试过了这个硬件

 

微软的搜索引擎Bing是一个运行在数千台机器上的在线服务,每台机器都是靠CPU驱动的。虽然Intel公司一直在推动硬件升级,但是这些硬件跟不上软件的进步是不争的事实。

 

尤其是在人工智能潮流兴起以后,Intel处理器的缺点被进一步放大。

 

而类似Bing这类的服务的需求已经超过了摩尔定律,大家发现,单纯靠增加CPU的数量已经不能解决问题了。

 

但另一方面,如果为每个新难题打造定制化专用芯片又太过昂贵,FPGA正好填补了其中的鸿沟。他们让工程师打造比流水线型通用CPU速度更快(因为FPGA是真并行)、功耗更低的芯片。可定制化让它能够从容面对瞬息万变的技术和商业模式。

 

在节后会议上,Burger主张BingFPGA上的执行能实现低功耗提速,但并不是很明朗。因此在接下来的几个月中,他们就根据Putnam的草图去做了一个原型,通过这个原型可以验证,新FPGA可以将Bing的机器学习算法提速100倍。正是这个数据吸引了微软对这个项目的兴趣,这也让Burger的团队进入了艰难的开发阶段。

 

原型机是一个内有6FPGA的专用盒,由满满一架子服务器共享。当盒子过热到滋滋作响,或者机器学习算法的复杂度增加到需要多于六个FPGA,整个系统就会奔溃。这让Bing的工程师无比抓狂。

 

因此Burger的团队又花了好几个月去改进,推出了第二个版本的原型,这是一个能被接入每台服务器的电路板,每个电路板只含有一个FPGA,但每个FPGA板都可以连接到其余所有服务器。这样就打造了一大批可以让任何Bing机器接入的可编程芯片组。

 

正是这个原型,让Bing的老大Qi Lu大感兴趣。他给了Burger一大笔钱,让他可以用FPGA建立一个拥有1600台服务器的测试环境。在台湾和中国大陆制造商的帮助下,Burger的团队还是花了六个月才打造好这个测试环境。他们最初是在微软园区的数据中心进行了相关测试,但碰上了事故,经过了三天的抢修,一切又回到了正常轨迹。

 

20132014年的好几个月里,测试表明Bing的“决策树”机器学习算法速度在新芯片的支持下有了四十倍的提升。在2014年夏天,微软声称会将这个项目移植到Bing的数据中心中,但稍后他们暂停了这一计划。

 

Bing之外,搜索更多应用

 

在早些年,Bing承载了微软的在线野心,但到了2015年。微软又多了两个大型的在线业务,一个是商务应用Office 365;另一个是云计算服务Azure。和他的所有竞争者一样,微软的掌门人意识到,要让其在线帝国高效的运行,那就需要打造一个统一的稳固基础。如果Project Catapult将会对改变Bing,那它也应该进入AzureOffice 365的“内芯”。

 

问题是Azure高管并不在意如何加速机器学习,他们需要的帮助在于网络连接。而Azure的数据中心在面对大流量时,也逐渐显得力不从心,因为传统的CPU已经跟不上他们的步伐了。

 

终于,Azure的首席架构师Mark Russinovich将目光头投向了Project Catapult,因为他们的服务器同样需要FPGA芯片,只不过这次需要在服务器和网络之间布置FPGA


第一个FPGA架构原型是一个被所有服务器共享的的盒子(版本0);之后就每个服务器有一个FPGA(版本1);之后就是在服务器和整体网络之间布置FPGA

 

FPGA团队需要再次重构硬件。因为在第三个版本的原型中,FPGA是放置在每个服务器的“边缘”,能够直接和网络连接,FPGA组依然能让任意机器直接接入,这就让它可以为Office 365助力。

 

Project Catapult终于能够活下去了。

 

据介绍,这个芯片的重构过程是非常痛苦的,不仅仅是因为要建新的硬件,而且每次都需要重新对FPGA编程。相对于软件编程来说,这简直就是一个噩梦。不但写程序艰难,正确的写程序更是难上加难。

 

这是一个极度繁琐的工作,就像在芯片上改一个微小的逻辑门那么繁琐。

 

既然芯片已经有了,那么对于微软来说,他们每次需要面对的挑战就是重新编程这些芯片。去了解这个世界是很艰难的。Project Catapult比传统的架构节省了30%的花费和10%的功耗,而速度则提高了两倍,这些优点让企业离不开它了。

 

微软Project Catapult的首次展示的阵仗非常大,Azure用它去传送数据,而在占有全球20%桌面搜索和10%移动搜索的Bing上,Project Catapult能够推动其AI神经网络更进一步。而Office 365则表示,使用了新的架构,能够大大提高了其压缩和加密的机器学习能力。Burger表示,这些芯片将会逐渐走进微软的服务器。

 

不过,这真的奏效吗?

 

微软Next研究所的负责人Peter Lee表示,Project Catapult还是让他有些困惑。

 

在纳德拉担任CEO以后,他一直推进Next的创新。他希望可以从中看到未来十年或者二十年的趋势。他希望从现在开始,能够改变微软的轨迹。Project Catapult是当中的一个先行者,展望未来,他们希望在业内缔造一个更庞大的转变,而这一切来源于一个不需要CPU的技术。

 


Peter Lee

 

包括微软在内的互联网巨头现在是用GPU去弥补CPU的不足,在这些巨头的人脸识别等神经网络应用中,GPU担任很重要的工作。同样,微软这些巨头也使用硅的替代品去执行神经网络操作。甚至是昂贵的定制芯片,他们也会去尝试。

 

现在看来,谷歌在自制神经网络芯片上面,走得比较远。那就是早前推出的让Intel闻风丧胆的TPU

 

TPU上面,谷歌为了速度牺牲了其长期的灵活性,他这样做是为了消灭手机上发起命令的延迟。问题是一旦谷歌的神经网络模式转变,谷歌就需要重新做一个新芯片。

 

而微软的FPGA则具有更高的灵活性,从长远来看,是更具备价值的。虽然这个FPGA并没有谷歌的定制化芯片那么快。但微软可以随着需求的改变重新定义芯片,以满足全新人工智能模式的需求。


新版本的硬件,版本2,能够直接接入微软的服务器和网络。

 

微软的服务项目是如此庞大,因此对FPGA的需求也是海量的,一旦成熟的话,就将会改变芯片市场。

 

去年Intel耗费巨资收购了FPGA老二Altera,英特尔的执行副总裁Diane Bryant表示,这笔收购的出发点就是Intel认为到2020年,三分之一的服务器将由FPGA提供计算能力。

 

在技术领域,GPUCPUTPUFPGA都是一些不同的而定义。在云计算时代,微软、谷歌和亚马逊这些企业推动技术的大踏步发展,它们所推出的那些替代芯片也会让APP和在线服务的应用范围更广。Peter Lee认为,到2030年,微软还能扩大其超级计算机的全球影响力,而在那之后,将会是量子计算的时代。

 

在最后,纳德拉谈到了微软的量子计算计划,虽然这看起来有点像空中楼阁,但多年前的Project Catapult又何尝不是这样?

摩尔精英


【关于转载】:转载仅限全文转载并完整保留文章标题及内容,不得删改、添加内容绕开原创保护,且文章开头必须注明:转自“半导体行业观察icbank”微信公众号。谢谢合作!

【关于投稿】:欢迎半导体精英投稿,一经录用将署名刊登,红包重谢!来稿邮件请在标题标明“投稿”,并在稿件中注明姓名、电话、单位和职务。欢迎添加我的个人微信号MooreRen001或发邮件到 [email protected]

点击阅读原文,查看更多半导体高薪职位