芯榜:半导体圈(微信:icquan)专业排行榜
加入半导体圈,加微信:416000888
由中国科学院计算技术研究所(中科院计算所)陈云霁、陈天石两兄弟创立的寒武纪科技(CambriconTechnologies)宣布完成1亿美元A轮融资,由国投创业(A轮领投方),阿里巴巴创投、联想创投、国科投资、中科图灵、元禾原点(天使轮领投方)、涌铧投资(天使轮投资方)联合投资。
中国正在发力人工智能芯片,以缩小与全球科技巨头的差距。
人工智能的“寒武纪”
大约6亿年前的时代在地质学上被称作“寒武纪”,大量无脊椎动物在短时间出现“生命大爆发”。中科院计算所陈云霁、陈天石团队将研发的全球首款人工智能处理器命名为“寒武纪”,也意喻着人工智能即将迎来大爆发的时代。
此轮融资令寒武纪估值达到10亿美元。
根据寒武纪网站上的介绍,公司去年发布的1A芯片是全球首个商用的能够“深度学习”的“神经网络”处理器芯片,面向智能手机、安防监控、无人机、可穿戴设备以及智能驾驶等各类终端设备,在运行主流智能算法时性能功耗比全面超越传统处理器。
寒武纪科技CEO陈天石解释道:“目前深度学习的应用这么多,但全都基于传统的通用处理器,如CPU或者GPU。例如几年前的一个老故事是,谷歌花了上万个CPU去训练猫脸识别模型。未来想要扩展至人脑规模的神经网络,不论是CPU还是GPU,都不足以支撑。”
他表示,基于历史的经验,在智能时代,我们需要有一类专门的智能处理器芯片。陈天石说:“寒武纪就是一个专门针对人工智能深度学习而设计的处理器,在图像、语音识别领域比传统处理器性能至少提高两个数量级,集成度也是传统处理器的数倍,让手机等移动设备搭载人工智能芯片成为可能。”
针对通用芯片和专业芯片的区别,陈云霁喜欢用“瑞士军刀”和“菜刀”做比喻。他认为,普通的处理器就好比“瑞士军刀”,虽然通用,但不专业,造成浪费,但是做菜的时候,还是菜刀得心应手,而专业的深度学习处理器就是这把更高效、更快捷的“菜刀”。
中科院计算所研究员,寒武纪公司联合创始人首席科学家陈云霁表示,寒武纪1A芯片可以解决两个方面的问题:一是显著提升计算机系统在人工智能领域的运算效能,可以超过传统中央处理器和图形处理器芯片两个数量级;二是终端产品的离线智能化,让很多用户数据不必上传,保证了信息安全。
目前寒武纪终端处理器IP产品已衍生出1A、1H等多个型号,据陈天石透露,寒武纪A轮融资将用于推动寒武纪系列处理器在终端和云端的产品化和市场化,促进各类终端设备的智能化,提供高性能低功耗的云端智能处理解决方案。
寒武纪正在紧锣密鼓地将芯片推向市场。据陈天石介绍,商业化主要是两方面:一是终端,二是云端。终端产品就是手机、智能眼镜、手环等等,需要芯片去识别图像、影音和文字。而在云端,像科大讯飞、曙光这样知名的云端客户,都已经是寒武纪的客户。
中国芯片距离引领世界有多远?
寒武纪团队成员的平均年龄只有25岁,很多骨干成员在校期间已开始从事相关领域的工作。面对中国人工智能芯片引领世界的消息,业内人士持有不同的看法。一位中科大研究员对第一财经记者表示:“寒武纪项目以中科院计算所为依托,起点非常高。而且该所曾孕育出像联想这样的企业,做一个中国人工智能硬件的龙头公司也很正常。”
中科院计算所是中国第一个专门从事计算机科学技术综合性研究的国立学术机构,被誉为“中国计算机事业的摇篮”。此前,中科院计算所已经成功研制了我国首枚通用中央处理器芯片“龙芯一号”。虽然“龙芯一号”曾被一些业内人士诟病,但仍然为中国芯片的发展做出重要贡献。“你当然不可能要求它和英特尔竞争,但目前还是在一些领域有应用的。”上述中科大研究员对第一财经记者表示。
Gartner研究副总裁、芯片行业分析师盛陵海对第一财经记者表示:“根据国家新一代人工智能的发展战略,人工智能芯片在安防、军事、视频人工智能算法等方面都有用武之地,而且是刚需,订单不用担心,只要技术过硬,完全可以取代英伟达的人工智能开发板Jetson。”
不过英伟达一位专业人士对第一财经记者表示:“寒武纪和英伟达的芯片没有很强的可比性,因为它是为专门目的而设计的集成电路(ASIC),就好像谷歌的TPU芯片就是为Tensor-flow设计的,会有局限性。而英伟达的GPU具有更大的扩展性,能根据不同的应用需要编程,为不同的算法优化,也能经得起技术升级的考验等等。”
“智能时代迟早要到来。”陈云霁表示,“每个时代都有其核心的物质载体,比如工业时代的蒸汽机、信息时代的通用CPU,智能时代也将会出现这个核心载体。”
咨询公司Tractica的预测数据显示,到2025年,与人工智能相关的深度学习芯片组市场收入,将由去年的5亿美元飙升至122亿美元的规模,复合年均增长率超过40%。
知乎作者:迪迦奥特曼出处
1. 因为机器学习的workload已经非常广泛,从庞大的数据中心云端到每个人手里的手机,以及将来的智能家电,智能可穿戴设备都跑着不同种类的机器学习算法(不一定是DNN),而传统CPU、嵌入式CPU体系结构做深度学习效率不高,所以有GPU、FPGA、ASIC的深度学习加速。
2. 设计GPU + 面向深度学习做优化,与从头开始面向深度学习设计ASIC,是有一定关联但是区别也非常大的两件事。我觉得这个问题应该反过来问,GPU面对天生的ASIC能有多少优势呢 :)
3. 我们接触过其他做CPU core的企业,正在评估做机器学习相关的workload,可以有比较大的把握说Intel肯定也在内部做过评估,但是为什么现在没有推出这样的芯片,原因就耐人寻味了,甚至连prototype都出了,但是内部又被拍死了也是完全可能的。大公司在面对新兴业务时的笨拙,很多时候跟技术本身是没有关系的。
4. 题主没有询问但是肯定很多人想问的补充 - 寒武纪的天使轮与A轮融资都是国内破纪录的数字,为什么这么被看好,投资人看中的不仅是寒武纪脱胎于国际顶尖级的学术研究团队,而且还有极为迅速的工业量产落地,过后1-2个月还会有更大的好消息公布。
因为自己在计算所工作,所以认识很多在寒武纪工作的杰出人才,融资消息发布的时候我刚好正在寒武纪开会,亲眼看着消息发布以后被各路媒体争相转发,这两天上门采访的知名媒体应接不暇。想想我刚到所里来的时候,他们还没有这么高的知名度,和所里的很多师兄弟姐妹一样,我们亲眼看着“Diannao”系列变成“寒武纪Cambricon”,一步步走到今天,发自内心地感到荣幸与自豪,在这波AI浪潮的大势下,也在我们工作的地方孵化出了一个当之无愧世界级的startup,刚才下楼吃饭还看到寒武纪的招聘启事和其他牛企在我们这里的专场招聘海报贴在一起,看着特别感慨。
虽然寒武纪现在势头非常好,但是学术出身的寒武纪团队真的是很低调,网上能看到的采访和相关报道与被婉拒的采访数量相比真是九牛一毛,作为团队leader的陈氏兄弟俩,陈云霁老师是一个会在ASPLOS workshop上谈招聘“要招人先问他打游戏能不能坐得住”的人,陈天石老师是一个跟所里的学生吃饭聊天,说跟自己学生一起打DOTA,团战开大开慢了差点被自己的学生骂的人。
作为比网上多数人更靠近寒武纪的角度,我看到的情况跟网上的流言有很多不一样,这些流言包括说寒武纪没有流片的,怀疑寒武纪没有技术优势的,蹭AI热点的,等等。说寒武纪没有流片的人肯定不了解很早就流片的事实,也不知道寒武纪成功推动这么大规模的工业化应用中付出的艰苦努力,说寒武纪没有技术优势的人,肯定不知道见过作为PI的陈氏兄弟俩坚持这个方向有多少年,曾经经历过没有得到项目资助还在找钱坚持研究,组里甚至留不住新招来的实习生这样的日子,也肯定更没见过他们在是两三年时间里横扫各大学术顶级会议,亚洲第一篇MICRO最佳论文,ASPLOS最佳论文,大陆第一篇TOCS论文,CGO最佳论文提名,ISCA审稿评分最高,ASPLOS第一次在中国召开,陈云霁老师作为大会general co-chair致辞的高光时刻。寒武纪如此被资本追捧的今天和明天都是他们这个团队应当得到的,并且也将会是顶尖级学术成果推动社会工业技术进步的经典案例。
===
update:
1)这几天收到很多询问,在此正面100%确认:华为的麒麟970搭载NPU,就是寒武纪的IP,并且,这也不是寒武纪的IP最后一次出现在华为产品线上,后继会有更多产品跟进。
2)Intel今年早些时候已经出了lake crest,感谢评论区的朋友提醒
知乎作者:Godfather
从报道中,可以看出该芯片主要用于两个场景,一是在终端,二是在云端。该专用处理器最大优势是相对于通用处理器,具有更高的性能功耗比(计算速度更快,更省电),从而希望“未来数年,移动终端(手机、手表、眼镜各种可穿戴设备)通过集成该专用处理器获得强大的本地智能处理能力”,就像GPU,DSP那样。
1.GPU和DSP的市场驱动力确实很大。所以,只有本地化智能信息处理的需求变成类似图像等信息处理的需求那么迫切的时候,这个远景才能真的到来。
2.信息处理到底是放在云端(云计算)还是终端(边缘计算),性能的提升是从计算架构(软)还是从处理器(硬)方面进行提升。市场会回答这些问题。很开心能看到国内有这么多相关成果涌现出来。
3.数据价值的产生除了处理,感知和传输方面也需要协同推进。否则,下一个瓶颈就变了。
4. 通用和专用适用于不同的领域。专用的崛起的必要条件是通用的在那个方面存在一些缺点。另一个必要条件就是,这个专用的领域市场驱动力足够强。目前,AI炒个的很热,但是真实的AI当然比媒体中宣传的那样要逊色。AI芯片是AI生态系统中的一部分,其能否真正带来直接经济回报,还要看AI应用的推广。一旦,AI应用静悄悄的融入我们生活和工作中,成为不可分割的一部分后(比如4G通信标准),时代就会又一次变革。
5.我想Intel推出自己的AI芯片并不是很难,有品牌效应存在,一旦推出可能更容易抢占市场。在外届没有能够匹敌的对手,以及市场需求估计不足的时候,他们也没有必要强推AI芯片。
6. 报道中,为了强调密集型AI算法计算效率存在的瓶颈问题,用了一个猫脸识别的例子。其实,我更希望看到更贴合生活的一些例子。用这些例子去说明AI算法计算时效的重要性更具有说服力。此外,计算时效和数据量、模型都有关系。一个企业,为了一个服务(应用)专门额外部署一些板子去跑AI算法,这又需要均衡成本和时效紧迫性。AI算法只是数据处理的一部分。比如,电信运营商,拿到用户数据后,需要进行更多的简单的统计类型数据处理。这些应用往往存取是瓶颈。总之,一个产品从诞生到成为生态中不可分割的一部分,任重道远。
7.体系结构拿了那么多best paper,确实不是一般的牛。
如侵权请联系QQ/微信:416000888
如侵删丨如转注
【整理不易,记得转发】
半导体人临走记得点下方拇指。如觉文章不错,留言评论,转发更多朋友,传递咱半导体人的观点。
推荐关注:半导体行业联盟(微信:icunion)
电子发烧友www.eefans.com 中国半导体论坛www.eefans.com 电子工程师论坛www.eefans.com
推荐关注:芯榜(微信搜索“芯榜” 添加关注)
电子发烧友www.eefans.com 中国半导体论坛www.eefans.com 电子工程师论www.eefans.com电子工程师
推广合作QQ/微信:416000888
觉得不错,请点赞↓↓↓