专栏名称: InfoQ
有内容的技术社区媒体。
目录
相关文章推荐
新浪科技  ·  【#Mate70系列样机到店##Mate70 ... ·  4 天前  
36氪  ·  新品牌AUDI诞生,新合资时代到来 ·  5 天前  
36氪  ·  什么是纯电轿车的爆款公式? ·  1 周前  
51好读  ›  专栏  ›  InfoQ

三问百度云,「ABC」如何帮它跑赢马拉松?

InfoQ  · 公众号  · 科技媒体  · 2016-12-30 08:00

正文

在这个没有硝烟却暗流涌动的战场里,作为国内云计算市场的后来者,百度云近来频频对外放声,力证其技术实力和战略思考。从7月云计算战略发布会、10月品牌升级,再到11月“云智”峰会,百度云逐渐将触角从单一的云服务伸向“云计算+大数据+人工智能”三位一体的发展领域。

面对外界对其抱以的“新瓶换旧酒”质疑声,百度云如何作答?而面对“入局晚不晚”的外界拷问,百度云为何说,国内云计算市场42公里的马拉松,领先者才跑了2公里,自己并没输?

第一问——ABC时代,百度云如何弯道超车?

自今年下半年开始,百度云开始频频放声。7月,百度云计算战略发布会得到了李彦宏首次意义上的站台,并发布了“云智数”三位一体的发展战略。

11月,百度云将“云计算+大数据+人工智能”三位一体战略换了个更顺口的名字——“ABC”。用百度总裁张亚勤的话说:“人工智能(AI)、大数据(Bigdata)和云计算(Cloud Computing)组成的‘ABC’将成为一个主流方向。以人工智能为中枢,以大数据为依托,以云计算为基础,‘ABC’深度结合的意义更多在于改造传统行业。

其实,对比国内整个云计算行业来看,ABC融合并非新提法,但三者协同促进发展已是大势所趋:

  1. 三者界限将进一步模糊。云计算是大数据的底层架构,人工智能是大数据的场景应用。

  2. 三者直接建立起一个体系,从而实现改变世界的目的。下一个风口,也一定是大数据、云计算、人工智能的共同风口。

那么同争“ABC”,孰输孰赢?在各家都拼了老命速建壁垒和“围墙”的格局中,百度云借什么弯道超车?

1.钱

百度在2016Q3研发投入达到了26.14亿元,占到总营收的14.3%,研发强度在全球科技公司中位于前列。同时,百度的技术开发投入也越来越高,本季度同比实现了46.9%的增长率。据知情人士称,该部分投入多用于人工智能上(约为 26.14 亿元人民币),比例甚至占到了百度总支出的15.89%。

除此之外,百度在本季度成立百度风投公司,专注于人工智能以及AR、VR等下一代科技创新项目。并在8月战略投资激光雷达公司Velodyne LiDAR,以加速无人车商业化进程。

因此,资本运作辅佐AI战略的推进,也在很大程度上导致百度在总营收上出现了较大幅度的下滑。

2.市场

国外谷歌、微软、亚马逊、IBM、甲骨文等巨头主要拼的是技术,而国内巨头除了竞技“技术”外,更会拼资本和市场。虽说百度云发力较晚,但不可否认的是,其数据入口庞大,基础资源较为集中,在面向市场这一环上,百度做云具备一定的先天优势。

比如,面向B、C两端的覆盖及其获取的大量C端搜索数据,其实能在很大程度上推动人工智能的技术发展和技术变现。Q3一组数据显示,在2016年9月,百度的移动搜索月活跃用户数达到6.6亿,同比增长3%,百度地图月活跃用户达到3.48亿,同比增长7%。而以这些数据为切入口,可强化人工智能在移动广告市场上的营收能力。

所以,百度要将云业务作为重中之重的决心已尽显,或许云也是扭转百度乾坤的一颗最重要的落子。不过,必须承认的是,此时的百度已错过太多,想追上先发者道阻且长。

并且,我们今天也看到的是,即使BAT三家,也没有人敢站出来说自己的“围墙”已建。但“下半场”的突破,还是在于各家如何发挥平台效应,搭建坚实的技术壁垒,使ABC发挥协同效力不再沦为一句空谈。毕竟,AI+大数据+云计算的应用终会成为企业的标配,而关键是怎么推动人类社会从过去的分析,现在的预测过渡到未来的认知。

第二问——ABC融合是幌子吗?

关于ABC怎么融合,是多数人更关心的话题。

7月,百度云推出“天工”、“天算”、“天像”三大平台时都在提及智能,而时隔短短3个月,“天智”又以独立的平台诞生,四大“天”字号中间是怎样一套业务逻辑?天算和天智都属于横向平台,天算在做大数据,天智在做人工智能。而天工和天像,一个面向IoT领域,一个面向内容、多媒体领域。看似独立为战的个体又怎样浑然一体发挥协同作用?

对此,百度云认为,ABC时代会产生三项数据大爆炸,即消费者行为大数据、物联网大数据亦或内容大数据,而四大平台可针对不同类型数据提供完整解决方案。有数据的地方必然有智能,我们需要机器学习算法对大量数据进行统计、预测和分析。很多客户在早期的时候,或许会认为这几个平台是各自独立的,但是随着对其使用的深入,他自然也会延伸到对其他平台的运用。

事实是否确实如此?这里,我们先从“天智”平台的定位来看。

“天智”平台包括三个子平台,即感知平台、机器学习平台和深度学习平台。其中,机器学习平台实际上是一个托管服务,相对于感知平台,它处理的不是基于数据一秒钟能解决的事,而是基于大量重复发生的数据做相应预测。因此需要将完整的数据训练流程打通,它必须要和“天算”平台有深度集成。

今年9月,百度将其内部大量数据系统组成的PaddlePaddle深度学习平台进行开源,PaddlePaddle内包含非常多的神经网络算法,目的就是完成多元数据的关联分析与模式挖掘。此外,“天工”、“天算”平台也和整个百度云可以进行深度集成,所有的数据在云上,使用所有的大数据能力进行处理。

因此,从具备感知、理解、决策三环的人工智能的技术层面来说,百度必须要将数据的潜能释放出来,将大数据和人工智能打通,才能实现后者从感知向认知的过渡。

单单从百度搜索发展轨迹上来看,云计算、大数据、人工智能在本质上是浑然一体的,需求优化不断上升、不断迭代的过程中,自然而然要去解决的问题。第一阶段,为了做好搜索这个业务,就需要有强大的云计算基础;第二阶段,搜索业务发展,用户规模成倍增长决定了,下一步必须要做大数据。而搜索本身要抓取大量的内容数据,进行内容分析,并基于大数据做未来预测,这时候就要大范围使用机器学习技术。

2013年的时候,张潼(现任百度研究院副院长)曾在QCon大会上总结当时趋势中表示,“深度学习的成功条件可以归纳为‘大数据+大规模计算能力+复杂模型+高效算法’”。这一点不存在太多质疑。从对ABC的规划来看,百度云目前整体业务的规划路径也是在照着这个方向走,开放“天”字号四大平台,再辅以百度自身的数据体量和资源管理基础,是在某种程度为ABC的真正融通做积淀。

其次,我们再从近年来百度在云计算、人工智能领域内几个重大的技术突破点来分析。

百度大脑。张亚勤这样解读百度大脑和百度云的关系:“百度大脑是百度云的核心引擎,百度云是百度大脑的云化,为前者提供了神经元和数据训练源。”从这个定义上来说,百度大脑应该是被百度看作连接云、大数据和人工智能的绝对枢纽。

从预测和感知、思考到决策、行动和创造,百度大脑的意义在于,使信息、人、物理世界通往具体的智能时代,让数据工厂发展为落地的产品,再发展为人工智能技术,完成这样一套“正循环”。

对比百度现有的几支在人工智能上的产品,百度大脑应该算是相对更成熟的一支。在把超过1000PB的数据和深度学习平台融合过程中,它已经可以模拟人脑工作机制,完成听、视、说、规划决策、推荐预测、行动控制等一系列行为。这是ABC三者融合实践的一次“头炮”,也对构建一个推动云、大数据和人工智能所共同倚靠的平台具有一定意义。

Deep Speech 。Deep Speech估计是百度目前最引以为豪的技术之一。除了从0到1的创新直接来自于Andrew Ng. 团队的研发外,它还被证明在含噪音的语音测试数据上,出错率比谷歌Speech API、Wit.AI、微软Bing Speech以及苹果Dictation低10%多。

在该项技术背后,Ng. 团队主要采用“叠加”原理,将原先的语音样本扩容成一个10万小时的数据,增加15类噪音,并用深度学习算法来替代早期的“隐马尔可夫模型”,而减少人力识别上的耗费。去年11月,Deep Speech 2又进行了一项演进,即将包含超过万段转录语音作为样例,用于构建声音和语词间的关联。


百度2014年公布的Deep Speech第一阶段成果:深层神经网络的结构。表示层(自上而下)和表示如何在GPU上并行化训练(自左至右)。第四层是一个双向递归层。蓝色和红色箭头表示向前和向后的方向、以及在这些层之间通信所需的GPU。

这或许从某种程度上证明,搜索引擎服务、人工智能、语音自然交互三者本身就应该是一组具有内在关联的技术。随着语料资源的积累、训练数据的匹配和丰富度提升,大数据和神经网络技术对人工智能的介入,将更好的推动语音识别及自然语言处理的开放平台成为连接人与设备的交互方式。

百度曾表示,Deep Speech的开发,就是为产生更多新型应用,尤其是在噪声环境中的语音应用。比如汽车内语音因为有车轮、马达、气流、环境音等噪声干扰,而一直悬而未决,未来百度CarNet便可采取新的语音技术;再比如百度EYE,试图改变商场导购方式的可穿戴设备,有了新的语音识别技术交互便可以很好地解决。

第三问——ABC的第一战场该如何定位?

张亚勤认为,国内的云计算市场就像跑一个马拉松,在这样的阶段里,永远不存在入局晚不晚,更不意味着入局晚就等于输。

随着大数据和人工智能接下来更广泛的渗入传统行业,被更多的企业所采纳。百度的媒体属性,以及在内容生态领域具有的优势,将为百度云利用云计算技术处理内容分发和存储奠定一些基础的竞争力。比如在智能交通领域,基于高精地图,百度云可以汇集大量的用户出行数据,另外就是在智能交通生态圈的打造上,百度云会作为一个底层,作为技术能力输出,并将整个生态连起来,让生态圈中更多的企业加入对智慧交通探索和分享。

而且在百度云看来,智慧交通也是ABC融合后,最容易在短期内产生效果的一块领域:这里面涉及到人与车辆设备的交互、道路的优选、拥堵的规避。因此,智慧交通领域或许将是人工智能、云计算、大数据合体发力的最佳战场,为了实现对交通视频数据的实时处理,不同设施之间数据的采集与上传,云计算平台、人工智能乃至物联网技术之间则要完成许多轮的无缝协同。

未来,百度更多的是加大在L3(有限自动驾驶)、L4(适应各种环境的自动驾驶)上的投入。或者说,为实现网联化、共享化和智能化的交通,百度将会更注重自身在生态系统中的调度和协同能力,并提升整个生态系统的运行效率。

看上去这是个很抽象的话题,但具体到落实,可能需要百度云真正能将未来的技术通过物联网接入云端,在云端中进行融合。

或许这一直跟百度或者百度云所一直强调的开放有关,百度云表示,“云本身偏底层,它最终是要解决业务问题,但也需要用业务的需求来推动其本身技术不断发展。”如此,无论是做ABC,还是用ABC输出的技术互相支撑百度内容各子生态的发展,亦或是为生态圈内更多的合作伙伴提供技术支持,百度云实质上都是在推动其自身这个大轮子的飞速前进。

只不过未来这个轮子能跑多快?以及在离马拉松终点还剩40公里的征途上,它还有没有可能赶超竞争者,跑在最前列?一切都是未卜。

大风起兮云飞扬,静待结局揭晓……