专栏名称: DeepTech深科技
“DeepTech深科技”是与麻省理工科技评论官方独家合作的一个新科技内容品牌。我们专注于关注三个方面:1、基于科学的发现;2、真正的科技创新;3、深科技应用的创新。
目录
相关文章推荐
新浪科技  ·  #华为MateX6开启预订#,你会考虑购买折 ... ·  2 天前  
新浪科技  ·  【#马斯克旗下SpaceX和xAI估值飙升# ... ·  1 周前  
新浪科技  ·  【#OpenAI回应AI教育界争议#:#12 ... ·  1 周前  
新浪科技  ·  【#雷军谈SU7Ultra定价##雷军称Ul ... ·  1 周前  
51好读  ›  专栏  ›  DeepTech深科技

独家首发 | 深鉴科技完成数千万美元A轮融资!全球产业巨头为何如此看重这家中国AI初创公司?

DeepTech深科技  · 公众号  · 科技媒体  · 2017-05-17 19:58

正文


据DT君独家消息,国内知名的 AI 创业公司深鉴科技完成了数千万美元的 A 轮融资,投资方包括赛灵思(Xilinx)、联发科(MediaTek)、清华控股、方和资本,原有投资方金沙江创投、高榕资本跟投 。 此轮融资之后,深鉴科技将继续自身技术的研发和产品化的推进。


谷歌开发者大会于本周三开幕,按照以往的惯例,谷歌将在会上发布 Android 系统最新功能。不过,其 CEO Sundar Pichai 曾表示,谷歌正逐渐将重点从移动互联领域转向人工智能领域


这不禁让人揣测,Google很有可能推出可应用于实际生产的人工智能新项目。在 2016 年的开发者大会上,这家科技公司就推出了自己的 TPU 芯片,希望利用专有硬件实现深度学习及其相关应用。



一个明显的趋势是,全球互联网巨头正在积极布局人工智能的上游产业——芯片:老牌芯片公司英特尔正在开发人工智能专用芯片,IBM正在设计基于大脑结构的芯片 TrueNorth。此外,Facebook、微软以及 Twitter 也都在进行相关的研发工作。


这些顶尖科技公司对人工智能芯片的重视是显而易见的。因为,任何精妙算法的实现都高度依赖于高性能的计算能力,而图形处理器(GPU)、现场可编程门阵列(FPGA)、专用集成电路(ASIC)在其中扮演着关键的角色。GPU可以平行处理大量琐碎的讯息,目前全球GPU代表厂商则是Nvidia。而FPGA凭借其可编程专用性、高性能、低功耗的特征,同样在深度学习应用中展现独特的优势,当前全球代表厂商为英特尔、赛灵思(Xilinx)


图丨基于FPGA的深度学习解决方案 


在中国,同样有一批拥有芯片自主研发能力并且雄心勃勃的企业涌现。目前,国内有许多创业企业,选择加入FPGA阵营,提供基于FPGA的解决方案。其中,比较有代表性的是源于清华大学的深鉴科技(DeePhi Tech)深鉴在 2016 年 OpenPOWER 峰会上崭露头角。当时,世界最大的 FPGA 制造厂商 Xilinx 介绍了他们眼中深度学习处理器的新方法,其中技术的部分大多来自这家中国初创公司


虽然成立才仅仅一年,深鉴科技凭借深度压缩、指令集与计算架构上的技术优势,所推出的深度学习加速解决方案正受到国内外专业人士的认可。在 2017 年初,深鉴科技完成了数千万美元的A轮融资赛灵思(Xilinx)、联发科(MediaTek)、清华控股、方和资本,以及原有投资方金沙江创投、高榕资本参与了此次投资 。 


去年 5 月,DT君曾专访过创立才数月的深鉴科技CEO姚颂,访问中提到的深度压缩、深度学习处理器等概念引起了业内很大的关注。同时,DT君也是深鉴科技本轮融资发布的独家首发平台。对此,我们再次专访了这位年轻的CEO。


图丨深鉴科技A轮投资方


在深鉴科技CEO姚颂看来,他们并不愿只做“一家卖芯片的公司”深度学习应用的最优解是GPU还是FPGA?一面是国内持续火热的AI投资,一面是国际老牌巨头的乘胜追击,这家中国的初创型人工智能公司如何在这冰火两重天内杀出重围?姚颂和DT君分享了他们正在前进的“少有人走的路”。


问:深鉴科技在2016年交出了一份精彩的学术成绩单,经过一年的成长,深鉴有什么新的进展?


姚颂:一年前,我们的技术大部分都仅在学术场景上进行验证。ICLR 2016评选了两篇最佳论文,一篇是我们的《深度压缩:通过剪枝、受训量化和霍夫曼编码压缩深度神经网络》(Deep Compression: Compressing Deep Neural Networks With Pruning,Trained Quantization And Huffman Coding)。另一篇是谷歌DeepMind的《神经编程解释器》(Neural Programmer-Interpreters)。


图丨深鉴科技CEO姚颂在Hot Chips演讲


产业方面,我们与全球最大的 FPGA 芯片制造商赛灵思(Xilinx)进行了交流,也与其他专注深度学习系统的硅谷公司进行了技术上的对比。之后,在 OpenPOWER 2016 峰会中,赛灵思在讲到未来使用 FPGA 作为神经网络处理器加速标准时,所用的到的技术方面的PPT都是直接引用我们的公司的核心技术PPT,包括压缩以及卷积神经网络的硬件结构等。


相较于学术界的肯定,能被世界上最大的FPGA厂商认可并推广,更是一件令人振奋的事情。公司和清华的一篇合作论文也被半导体工业界的顶级会议Hot Chips 2016 录用。


现在,经过一年的磨炼,我们不断在工业场景中验证了我们的压缩、编译、DPU架构等技术的高效性。深鉴也从最开始 10 余人的纯技术团队发展成了包含技术、产品、商务的 70 人团队。举个简单的例子,大家可能知道在一年前,我们提供给客户的开发板还是基于第三方购买的开发板,但现在深鉴已经有了更完备的产品体系,开始迈向追求市场与收入的道路。 


问:无论是国内还是国外,越来越多的企业关注AI的芯片业务,深鉴科技和其他企业有什么差异性?


姚颂:其实,深鉴科技并不是一家芯片公司,而是一个基于核心DPU平台的行业解决方案提供者而DPU是和CPU、GPU不相同的一个新概念。


之前,大多数算法都是针对CPU和GPU,深度学习出现后,深鉴基于以下几个考量,决定提出DPU:首先,深度学习算法可以实用了,如果这个算法之前的精确度不足以实用,那么也没有必要专门开发DPU。


另外,我们能够通过一个通用性的处理器来支持它,因为通用的神经网络基本上就是卷积层、非线性层、池化层,哪怕网络结构不同,最底层也还是这些基本单元。那么,一个支持这些底层操作的较为通用的处理器单元是可以满足这种要求的。


这就好比最开始我们需要运行一些程序,所以需要CPU,但后来大家开始玩游戏,发现CPU满足不了3D渲染的需要,所以又加入了GPU。但如果深度学习技术像图形显示一样成为主流,大家都要具备智能计算的能力,将有一款专门的产品来替代,这是毫无疑问的。


图丨深鉴科技开发的“雨燕”深度学习处理平台


与主流CPU、GPU相比,DPU的具体性能表现性价比更高。深度学习算法分为训练(Training)和应用(Inference)两部分,我们不得不承认,GPU平台并行度相当高,在算法训练上也很高效,但在应用时,一次性只能对于一张输入图像进行处理,并行度的优势就不能完全发挥出来了。而DPU只用于应用,也就是 Inference 阶段。


目前基于 FPGA 的 DPU 产品可以实现相对于GPU有1个数量级的能效提升。如在服务器端,我们基于 FPGA 的 DPU 板卡能够做到以更低的成本、低80%的功耗,实现多线程神经网络计算任务延迟降低数倍。而且兼容现有服务器与机房,可以实现即插即用。嵌入式端,DPU系统同样可以在降低80%功耗的情况下取得比GPU更好的性能。


而且,从产品开发周期、迭代速度、生产成本、利用率方面来看,DPU产品虽然依托于FPGA平台,但是利用抽象出了指令集与编译器,可以快速开发、快速迭代,与专用的FPGA加速器产品相比,也具有非常明显的优势


不过,由于DPU是专门针对于深度学习算法设计,其应用范围只能是深度学习算法,而不像CPU与GPU那样通用。因此,在一些应用场景中,需要以DPU为核心,辅之以非机器学习或者非深度学习的方式相结合来打造完整系统。以手势检测为例,手的检测任务可以DPU运行深度学习算法来检测,但检测之后,判断手势速度我们会依赖摄像头和物体之间的几何关系求得,这一步就需要依赖于传统的方法了。当然,能否让用户用得习惯也是需要努力突破的地方,所以我们在一键生成指令上进行了很大的努力。


目前,我们关注于为安防、数据中心等行业提供完整的人工智能硬件模组与配套软件。我们的方案具有高效、灵活、易用的特点:我们的深度压缩技术与DPU架构,可实现更强大的深度学习计算性能;我们设计的指令集可以方便用户“一键部署”不同的神经网络算法,真正实现产品的灵活性; 软件工具链和多样的硬件接口也让用户直接体验到易用性。整体上,我们的解决方案在性能、能效比等方面具有强大的竞争力。 


图丨深度压缩+硬件加速,一键从算法映射至专用处理器


问:深鉴科技一直强调稀疏性,我们也在Google推出的 TPU 上看到他们对这个特质的强调,您能给我们具体解释一下为什么稀疏性得到如此重视么?


姚颂:神经网络本身具有很强的稀疏性,因为它内在的特征分布是比较稀疏的。所以,如果我们可以支持这种稀疏性,做好神经网络深度压缩,就可以进一步实现加速运算具体体现在访问内存的延迟变少,内存读取功耗下降,进而减少芯片的大小,获得更好的性价比。所以,在现在的工业界,Google、Nvidia 同样在加大稀疏性方向上的研究力度,而且可能在未来给予更多的重视。


问:人工智能正成为中国投资新焦点, 您怎么看这个现象?


姚颂:确实眼下 AI 行业的投资很火热,而且有越来越多的投资人关注和理解“深科技”,我觉得这对AI产业的发展是一个好事情。但是人们往往会高估新技术在一年内的短期发展,却低估它在五年内的发展,眼下大家对于 AI 短期内技术发展的过高期望会带来一定的投资过热,但站在 5 到 10 年的角度,我相信 AI 很可能是人类社会的下一个时代。


问:深鉴科技此轮融资中有一个很有趣的地方,赛灵思、联发科、清华控股现在是投资方,这对深鉴来说意味着什么?


姚颂:我们希望在全球都有广泛的布局。虽然才成立一年多,但我们也很荣幸看到深鉴在国际科技圈,特别是AI相关领域得到了不错的评价。这一轮融资也是得到了赛灵思、联发科等在国际市场上有广泛渠道的企业的投资,这有利于帮助我们进一步开拓美国等国际市场,希望我们在日后也会向大家展现出更加完整的国际布局。


图丨由左至右:深鉴科技CEO姚颂,赛灵思COO Victor Peng, 深鉴科技CTO 单羿


赛灵思作为全球最大的 FPGA 可重构平台的提供商,在嵌入式视觉、数据中心等领域在全球有广泛布局。赛灵思过去与深鉴团队在学术与产品上已有多年合作,未来双方在人工智能领域会有更强的合作前景。联发科在智能手机、家庭、汽车电子等领域取得了令人称赞的成绩,深鉴科技有很多地方需要向行业前辈学习,希望我们的努力能成为华人共同的骄傲。


而作为从清华中孵化出的技术创业企业,我们希望进一步加强与清华的合作,尽我们所能回报母校。


问:A轮融资之后,深鉴打算怎么使用投资人的这笔钱?


姚颂:这笔钱将主要花在进一步的研发投入与产品化上。作为以技术为核心的创业公司,我们历来重视技术上的前沿性,尤其是加大压缩、DPU 架构等核心技术上的研发。因为我们还是有不少竞争对手的,国内就有在做类似DPU概念和产品的比较优秀的团队。整体人工智能硬件的市场也还在培育,我们也希望大家一起让这个方向成为主流。


图丨搭载了深鉴DPU的无人机

 

同时,我们将不断加强在安防领域、数据中心领域上的产品研发和市场销售 。目前我们在着手打造无人机和服务器两个行业的两款核心产品。这两款产品不是小规模的概念性产品,而是可以大规模上线的商业级产品。应用领域将分为终端和云端两类。就终端市场而言,可能针对的领域包括ADAS、无人机、机器人,以及安防监控;云端市场将核心针对大型互联网公司的语音识别和图像处理,从云计算角度讲,如果能用DPU替换原有的CPU、GPU服务器,性能提升与功耗下降带来的益处将是巨大的。


我们定位在深度学习平台公司,公司将以DPU为核心打造解决方案,不仅仅是提供芯片,而是提供行业内的整体的接口和SDK,方便所有人使用。我们的目标是不仅打造最好的深度学习处理器技术,也要打造最好用的解决方案和最高效的整体系统。当然,在未来,我们会有一部分的开销将专门针对于知识产权上的保护。


「DeepTech深科技」招募编辑记者

(人工智能、生物医学、自动驾驶等方向)

工作地点:北京 ● 国贸

申请加入:[email protected]


热点(点击关键词查看)

人工智能 丨 量子计算

 丨 合成生物学 丨 金属氢 丨 时间晶体 丨 区块链 丨 半导体 丨 激光雷达 丨 桌面打印 丨 人造子宫 丨 空中取水 丨 基因编辑 丨 海水淡化 丨 图灵奖 丨 超级高铁 丨 无鸡鸡肉 丨 人兽嵌合体 丨 钢铁骨骼 丨 高熵合金 丨 新固态电池   超级细菌 丨 渗透能 丨 量子纠缠 丨 垂直农场 丨 核聚变


人物

黄仁勋 丨 吴恩达 丨 张锋 丨 孙正义 丨 霍金 丨 马斯克 丨 比尔盖茨 丨 张首晟 丨 丁肇中 丨 吴军 丨 吴甘沙 丨 MIT陈刚 丨 Gary Marcus 丨 黄欣国 丨 Yann LeCun 丨 李飞飞


深度

AI 正停滞不前 丨 英国政府发布《量子时代的技术机遇》 丨 美国陆军报告 丨 2076年的人类世界 丨 看美国防部如何搞定硅谷 丨 技术孤寒与资本嗜血 丨 中国该不该建大型粒子对撞机 丨 奇点大学创始人:HI 将超越 AI  丨 世界已危机重重:麻省理工学院2016年毕业典礼演讲全文