【AI创新者】是CSDN人工智能频道精心打造的专栏,本期主人公是IBM系统实验室高性能开发部负责人宋煜。
记者:景琦
编辑:王艺
更多【AI创新者】征集中,采写AI领域杰出学者、资深专家、技术缔造者、顶尖团队。寻求报道请邮件[email protected],或扫描文末二维码加我微信。
对宋煜的采访是在2017年3月18日,CSDN与IBM合办的IBM Power马拉松大赛现场,宋煜作为大赛评委与参赛选手度过了紧张而又充实的12小时。
宋煜,IBM中国系统实验室高性能计算部门开发部经理。有丰富的高性能集群调优和算法方面的经验。曾经开发过针对WRF天气系统运算模型预测的机器学习软件。同时是开源实时物体检测框架项目eyes的发起人。该项目是一个基于深度学习的C语言为基础的物体检测框架。目前领导中国的团队开发并行化的深度学习平台BlueMind的开发工作。
CSDN:宋煜老师您好,首先请您介绍一下您和您团队正在做的事情。
宋煜:我们团队在做分布式的深度学习平台,前段时间我们和CSDN合作过一个Blue Mind的公开课,Blue Mind是我们目前在做的一个比较大的产品。我们做Blue Mind的初衷是,我们发现现在很多科研机构、企业、个人都在做框架,或者利用框架来学习,但说实话,深度学习目前门槛还是比较高的。准确率、集群训练的效率等,这些都是门槛所在。我们是想要降低这个门槛,这就是目前的关注重点。
CSDN:人工智能也火了有一两年了,您觉得现在人工智能领域的市场现状是什么样的?目前遇到了哪些具体的痛点?
宋煜:人工智能大概已经有三四十年的历史了。我们今天所说的RNN、CNN其实都不是新东西。随着计算力的发展,尤其是GPU的发展,深度学习又向前迈了一大步。从2012年开始人工智能有较大的突破,AlexNet在ImageNet竞赛中一举击败了传统的模式识别方式,AlexNet此后也得到了长足的发展。在2012年以前,人工智能经历过三次起落。现在的人工智能热可以说是处在波峰。但这次和以往不同,我觉得这次离现实应用更近了,特别是在图像和声音领域。在自然语言处理以及情感分析上我们还有一些路要走,但我觉得未来人工智能一定是呈上升发展的状态。
这过程中肯定会有波折,比如在数学层面上,我们目前利用概率来解决大多数问题,或许概率不能解决所有问题,那就需要有一些新的方法出来。不过,我觉得未来大的方向一定会大量通过人工智能解决现在工业生产生活中的大部分问题。不管怎么说,深度学习的确是离实际应用更近了,现在不管是自动驾驶也好、基于深度学习的安防也好、制造业的产品检测也好,我们已经看到很多实际应用的出现,未来会有更多,这是趋势。并且,我们能看到很多传统行业也已经开始使用人工智能,这是市场越来越大的一个标志。
CSDN:您刚才提到了GPU的发展为人工智能带来了革命性的改变,那么CPU+GPU这种合作模式,为什么能改变以往不能解决的问题?
宋煜:其实CPU+GPU这种模式很大程度上还是依赖GPU的发展,因为真正的训练工作都是在GPU上进行,那么CPU的作用在哪里?实际上不管是并行化训练还是训练过程中的一些迭代情况,CPU都要参与一部分的工作。当然现在也有很多GPU to GPU的方式,之所以大家不选GPU to CPU,更多地是在考虑带宽的问题。
我们这次大赛使用的IBM Power8+Nvidia P100的架构,因为我们的Nvlink可以在CPU-GPU的通信中也提供GPU to GPU一样的带宽,那么在这种情况下我们就有了更多的发挥余地。比如PowerAI的framework里有一套IBM Caffe,我们有一项专利技术在里面,我们可以在Gradient的计算过程中,将一部分层通过GPU到CPU的通道直接返回回来,而不用等到GPU计算完整的Gradient后,才做一次数据交换。相比于计算完全部层的Gradient再做Reduce操作的方式,这样的方式大大减少了等待时间,减少了延时。实际上在整个性能上会比在BVLC的标准的Caffe上的训练的GPU to GPU的方式要快15%到20%。特别是模型越大,这个优势就越明显,而模型大也是现在一个发展的趋势。随着模型层数越来越多,GPU加CPU的优势会越明显。GPU+CPU肯定是一种很好的编程模型,会在整个人工智能领域有一个很长足的发展。
CSDN:IBM在AI领域未来会有哪些布局?
宋煜:这个问题相对比较大一点,大家都知道IBM在人工智能方面最主要的品牌是Watson。Watson更像是在人工智能领域里的一个完整的方案,它能提供天气、医疗、交通等各方面的分析和解决方案。用户不一定需要自己做神经网络的训练,通过调用Watson的接口就能够直接使用。同时我们考虑到有一些用户会有保密性相关的需求,可能想要有自己的专利的考虑,那么对于这些用户,他们更希望我们提供一个平台,让他们在这个平台上去做个性化的设计,这就是Power Systems要解决的问题。硬件加上Power AI的一套Framework再加上Blue Mind软件,这一套方案结合起来使用户专注于他们自己的业务模型的训练分析。所以说IBM会有两个大的方向,对于行业来说我们有很多深度学习解决方案可以直接使用,如果用户想要自己做,也没问题,我们有也有一套完整的解决方案。
CSDN:现在倡导人工智能的企业还是有很多的,不管是BAT还是Google,那IBM在人工智能领域,跟其他巨头有哪些不一样的点呢?
宋煜:这个也是今年IBM CEO提到过的,我们做AI这件事的目的是为了改变世界,而不仅仅是为了做技术本身,也不是为了做算法本身。技术和算法是为了真正地让它应用到实际的行业领域里去。IBM在实际的行业领域里走的比其他公司更远一些,或者说做得更多一些。Watson就是一个很典型的例子,Watson利用不同的Framework,不同的技术,不同的分析数据的方法来解决最终的问题。它会把深度学习的模式,机器学习的方法,甚至还有传统的模式识别的方式,把这些东西结合在一起,真正地、完整地解决行业问题。比如金融行业、医疗行业的问题。IBM在癌细胞方面的研究,就有很大的突破,识别率可能已经高于了专业医生的水准,这样Watson就可以辅助一些医院的医生做初步的诊断,那么患者在等待结果报告的时间将会缩短。所以,IBM现在会更注重实际的行业应用。
CSDN:您刚才介绍了一下IBM Watson的行业案例,那Power8+GPU方面有没有一些具体的行业的案例可以跟我们分享?
宋煜:在金融机构合作中我们会做一些股指期货的预测,我们会根据短期交易预测未来的市场交易波动的可能性。不同的金融机构有自己的侧重点,这就涉及到个性化的部分,而且秒级的交易数据对每个公司来说很都很敏感,公司不会把数据拿出来。在这种情况下,他会愿意选择IBM的Power Systems,这样他就可以在自己的私有集群上来做预测。我们帮他们做的是在他不确定模型的方向的时候去通过数学方法和集群的计算力搜索到一个更好的超参组合,帮助这个模型更快的收敛。从效果角度来说,在某些情况下,我们用前四天的数据预测第二天的数据的准确率可以达到75%,这个比例已经很高了。当然这个离最后落地,真正地去做交易肯定还是有一定的距离,还有很多的事情要做,包括到底什么时候该买,什么时候不该买。收益率,赔率,回撤等,因为买卖是有延时性的,在策略上还有很多要做的事情。Power Syetem、Power AI、包括Blue Mind协作起来,就是为了在帮助行业用户去解决实际问题。
CSDN:你刚才说在模型的使用上面为客户提供一些帮助,这个帮助是指IBM提供的技术支持人员?
宋煜:我们为客户提供两方面的服务,一个是性能,包括硬件和软件性能;第二个是技术上的支持,但这个技术支持现在指的不只是人力支持。人力支持是有限的,实际上我们是利用一些独有的数学算法,只要客户有足够的计算力,我们可以在尽量短的时间里帮客户找到一个最优解。这个推荐的最优解也许不是整个解空间里面真正的最优解,但是我们会通过一系列的数学方法来保证它是最优解或者靠近最优解分布空间的概率是最大的。用户再用这个最优解去做他的事情,会事半功倍。
CSDN:那最后一个问题,请您简单描述一下您眼中的人工智能的未来。
宋煜:我觉得至少在接下来的二三十年,人工智能会处于一个上升的状态,我们生活中的很多事情也会发生变化。不管是在安全领域还是在金融领域。就像我刚才所说,75%的隔天预测率落地之后,就有可能会改变期货的交易模式。在制造业,在质量检测等方面也会大量地使用人工智能。现在中国在提工业4.0,就是在做各种参数的标准化,一旦各种传感器以及检测技术的参数标准化之后,人工智能在数据的海洋里就会取得大量的信息,从而提升产品的质量控制。在交通行业,比如拥堵状况分析,现在都是靠人工来预测,很少有机器的参与。我们知道在北京有潮汐的路,在某一个高峰期协助进行路况疏导,目前这个设计还是按照早晚高峰的时间,是固定的。可能在未来,在人工智能能够预测的时候,当有一些突发情况导致道路拥堵时但还没有引起连锁反应时,我们就能够提前采取措施。在金融领域,信用卡欺诈是大家很头疼的问题,我相信人工智能的介入也能够很好地辅助解决这个问题。因此我们说,未来二三十年,人工智能将给各个行业的工作模式带来极大的改变。
【AI创新者】专栏精彩文章:
驭势吴甘沙:做无人驾驶的赋能者
CNN之父Yann LeCun:预测学习才是AI的未来
小蚁首架张骏峰:让图像AI人尽可用
Twitter施闻哲:图像质量的评判标准是超分辨率的下一个关键
云知声梁家恩:当 AI 遇见 IoT——云知声的 AI 之路
TensorFlow贡献者黄文坚:解读对比13个深度学习框架后的选择
TensorFlow 贡献者唐源:掌握 Google 深度学习框架的正确姿势