专栏名称: 小田看投资
不端不装,有梦有趣,做一个最会写财经段子的清华理工男
目录
相关文章推荐
深圳商务  ·  春节假期,深圳外贸“欣欣向荣” ·  2 天前  
深圳商务  ·  春节假期,深圳外贸“欣欣向荣” ·  2 天前  
51好读  ›  专栏  ›  小田看投资

四个维度看深度学习平台飞桨如何成为人工智能的基础设施

小田看投资  · 公众号  ·  · 2019-11-08 19:24

正文

公众号“小田记事本”(xiaotianbook)是财经专栏作家向小田的自媒体,关注产业金融、资本市场、互联网科技、VC/PE等领域。


(百度飞桨应用落地案例集锦)


飞桨在四个维度上的优势,正是中国AI产业的机会。

文 | 向小田


提到人工智能,几乎所有人都能做到一知半解,毕竟,这项并不算新的技术已经渗透到我们生产生活的方方面面,而作为计算机科学的一个重要分支,人工智能背后自然少不了底层的基础技术支撑,这其中,深度学习给出了实现人工智能的路径,让非生物体有了思考和学习的方法,成为了推动人工智能发展的最大功臣。 这也使得无数开发者趋之若鹜,而有开发者的地方,自然有江湖,在 11 5 日的 “WAVE SUMMIT+”2019 深度学习开发者秋季峰会上我见证了一场属于深度学习开发者的狂欢。



值得一提的是,今年上半年, WAVE SUMMIT 已经举办了一次,当时现场来了许多来自百度、华为、英特尔、清华大学等产业界、学术界的专家学者和近千名深度学习开发者,场面十分热闹,也说明了深度学习正在掀起一个热潮,越来越多的人开始关心甚至参与到这个行业中来,行业的价值正在凸显。 如今间隔不久,就又召开了一次,可见行业的发展真的是一日千里,行业又有了很多新的进展和升级。


这次峰会上,最为值得注意的是,刚刚在乌镇世界互联网大会上获得 世界互联网领先科技成果 的百度深度学习平台飞桨( PaddlePaddle ),全新升级和发布了 21 个产品方向。 这次发布的特性和服务比上次春季峰会多出接近一倍。 这些新的产品方向包括面向产业应用场景的四大产业级开发套件、融合数据和知识的预训练结合迁移学习的飞桨 Master 模式、端侧推理引擎 Paddle Lite 2.0 EasyDL 专业版、前沿技术工具组件等等。 可以看到飞桨的易用性在全面提升,越来越好用,门槛越来越低,服务能力越来越强。 飞桨正在成为开发者进入 AI 时代的水电煤气。 基础设施铺好之后,产业智能化的新工业革命就要加速展开了。


为什么说飞桨的进步会加速 AI 在中国前进的步伐呢? 这就要首先理解飞桨的意义所在。 飞桨作为国内领先的开源开放深度学习平台,打下的是中国 AI 产业的根基,许多产业生态可以在上面成长起来。 飞桨作为深度学习技术的龙头,代表中国参与全球竞争,在当前的国际环境之下,对于中国科技的自主创新意义也比较大。 其次,飞桨作为深度学习平台的龙头,在四个维度上体现它的优势和意义。 这四个维度分别是: 技术、共享、应用和生态。 我们就来细说说这四个维度。



01

第一个维度:技术的领先


深度学习框架是 AI 时代的操作系统、基础设施。 不管是无人驾驶、智能家居,还是智能客服、物联网等等 AI 应用,都离不开它的开发、训练和预测服务。 飞桨作为百度的深度学习平台,集深度学习核心框架、基础模型库、端到端开发套件、工具组件和服务平台于一体,扎根于百度长期在深度学习领域的技术积累和产业实践,是国内最早,也是技术最丰富、使用人数最多的产业级深度学习平台。



目前,飞桨已经基本上形成了通用、灵活的特点,能够为 AI 开发者提供标准化、自动化、模块化的服务。 AI 开发者可以使用飞桨进行 AI 的开发、训练和预测,不需要再写大量的基础代码。 飞桨丰富的模型库,包括智能推荐、视觉、自然语言处理、语音等等,可以直接被开发者引用来实现特定的功能。 比如此次全新发布 4 大面向应用任务的产业级开发套件,实现了四大应用任务的全流程开发、训练和部署,更加方便实现应用落地。 包括: NLP 领域的 ERNIE 语义理解, CV 方向的 PaddleDetection 目标检测和 PaddleSeg 图像分割,推荐方向的 ElasticCTR 点击率预估,降低开发门槛,满足低成本和快速集成需求。 此外,飞桨还提供了越来越丰富的工具组件,新推出的联邦学习 PaddleFL 、图神经网络 PGL 和多任务学习 PALM 3 项深度学习前沿技术工具组件也在引领深度学习技术潮头。



进一步说,飞桨在四个环节上已经形成了技术的先发优势,包括:


1 )开发便捷的产业级深度学习框架;
前段我们提到,飞桨的特色在于其支持的模型多,其核心框架采用基于编程逻辑的组网范式,对于普通开发者而言更容易上手,符合他们的开发习惯。 同时支持声明式和命令式编程,兼具开发的灵活性和高性能。 网络结构自动设计,模型效果超越人类专家。 如此一来,开发自然较为便捷。


2 )支持超大规模深度学习模型的训练;
互联网每天产生的数据是海量的,尤其是搜索,更是亿级的用户产生数百亿级别的数据。 飞桨源自百度自身应用,百度的深度学习技术源自搜索,因此飞桨天生具备大规模数据的处理能力,并且搜索和推荐系统本身就是大规模数据分布式模型训练的主要应用场景。 所以,从一开始,飞桨就被设计为支持超大规模深度学习模型的训练。
针对大规模稀疏特征,飞桨设计并且开放了大规模稀疏参数服务器,适用于超大规模数据、海量特征和自膨胀、高频率模型迭代的业务场景。


3 )多端多平台部署的高性能推理引擎;
随着技术的进步,人们要求在电脑、智能手机乃至智能家居、智能穿戴设备等多个平台上都可以使用 AI 技术,这就对深度学习框架提出了较大的挑战。 飞桨对推理引擎的底层架构设计进行改进,显著提升了其拓展性和兼容性,使得飞桨推理引擎能够在多硬件、多平台以及硬件混合调度的支持上更加完备。
据悉,飞桨的端侧推理引擎 Paddle Lite 2.0 能够支持的硬件平台非常丰富,包括 ARM CPU Mali GPU Adreno GPU 、华为 NPU 以及 FPGA 等诸多平台。 这种多端多平台的能力保障了人工智能应用落地移动端的要求。


4 )面向产业应用,开源开放覆盖多领域的工业级模型库。
我们前面也提到,飞桨的模型库种类丰富,这些种类面向产业需求,目前已经可以在多个领域开展应用。 我们目前可以看到,比如用在冶金领域,在电网检修领域,在工业故障检测领域,在农业监测领域,都可以找到种类丰富的各种案例。 这些案例的应用,没有工业级别的模型库是做不到的。 实验室用到的模型可以解决一两个技术问题,但是商业化对于量的要求、对于质的要求更高更苛刻。


02

第二个维度:共享的领先


要做好 AI 时代的操作系统,不开放是不行的。 国外用的比较多的开源平台是 Tensorflow ,国内则是飞桨。 其实大家近期可以看到, Github 上面对于来自中国的开发者限制越来越多,甚至 Github 本身也不再给中国人发 offer ,美其名曰避免技术泄漏。 在这种环境之下,采用 Tensorflow 对于国内的 AI 产业来说,有比较大的所谓 断供 隐患。


除了上面这一层担忧之外, Tensorflow 虽然也是共享开源的,但是相对偏底层一些,使用的时候自己还是需要写大量代码,对于没有那么熟悉深度学习的开发者来说,入门难度比较高。 飞桨的特点就是不仅开放开源,而且 easy to use ,很适合入门开发者迅速掌握。


好用,简单,是一个共享平台能够在业内迅速使用开来的很重要的优势。 当然,作为一个共享平台,官方的支持力度也是相当重要的。 飞桨的背后是百度这样一家中国本土的公司。 在技术迭代、用户响应、本地化方面,飞桨自然是要比其他深度学习框架来得更贴近。 百度不仅通过大量的培训、学习,帮助开发者理解掌握飞桨,还提供了激励、算力、开放平台、 AI 市场来帮助产业参与方共同做大做强,这里共享的不仅仅是技术,而是广泛的资源。
03

第三个维度:应用的领先


纵观国内,在其他行业内已经开展广泛应用的深度学习平台,唯有飞桨。


百度 CTO 王海峰曾经以自动提取农耕地块为例,介绍了飞桨的实际应用效果。 基于飞桨的农作物地块识别,在遥感影像数据的基础上,中科赛诺将提取地块准确率高达 80% ,处理效率相对人工提升达数万倍,真正做到了高效辅助农作物生长、灾害监测、估计产量等等,把人力从农业生产中解放出来,对农业生产意义重大。 在土地集中化、农耕机械化、人口红利锐减、农田无人耕作的现实下,使得深度学习做到了技术报国。


又比如,在电网领域,巡检是一个非常重要的工作。 但是同时,这个工作非常辛苦,也相当危险。 过去,由于缺乏人工智能的支持,即便是用机器人去采集数据,但是采集回来的数据也需要大量的人工分析,费时费力。 直到南方电网与飞桨合作,通过 AI 算法赋能智能终端,帮助前端智能装备(无人机和机器人),把采集回来的图像数据进行智能化、自动化的处理,才真正做到了解放劳动力。 如今,广东南方电网的机器人巡检可以在变电站顺利开展工作,巡检人员再也不用自己去检测,只需要进行数据的复核即可。 巡检工作全天候开展,人工智能把人从危险劳累的环境中解放出来,可以从事更有创造性、更有效率的工作。



再比如,在钢铁熔炼领域,熔炼的过程中,如何精准控制合金添加量,如何废物回收利用,如何控制最佳冶炼时间,都是一个经验活。 过去,这种工作需要老师傅来判断。 如今,基于飞桨,精诺数据推出了智能熔炼系统,可以帮助钢厂工人更好的进行决策,来决定最佳的预配方案,保证成本最低化和质量最优化。 以往,普通师傅精配步骤一般用时 10 分钟左右,而如今只需要几秒钟,这中间节约的时间能够让工厂的产能提高近一倍。 原来一个老师傅可以看 2 个炉,现在可以看 4 个炉,效率提高了一倍。







请到「今天看啥」查看全文