作者:胡祥杰 刘小芹 张易
【新智元导读】 新一期全球超级计算机500强榜单19日公布,中国“神威·太湖之光”和“天河二号”第三次携手夺得前两名,美国20年来首次无缘前三。超级计算的竞争白热化,美国17日公布E级超算计划,华尔街日报称这是与中国争夺霸主地位的重要举措。中国的E级超算计划如何应对?新智元近日走进国家超算无锡中心,采访到几位核心管理人员,深入解读神威·太湖之光以及中国的E级超算计划。
根据新华社的报道,新一期全球超级计算机500强榜单19日公布,中国“神威·太湖之光”和“天河二号”第三次携手夺得前两名,美国20年来首次无缘前三。神威·太湖之光继2016年两次登顶后,再次位列世界第一,成功拿下三连冠。
值得一提的是,今年的第三名是来自瑞士国家超算中心升级版的Piz Daint,上升了5位。
2017年Top 500 世界超算前10名
TOP500是针对全球已知最强大的电脑系统做出排名与详细介绍。此项目始于1993年并且一年出版两次最新的超级计算机排名列表。每年的第一次排名公布总是在六月份的国际超级计算机会议上,而第二次排名公布则是在十一月份的超级计算会议上。此项目主旨在提供一个可靠的基础去追踪与侦测高性能计算的趋势。
TOP500榜单由德国曼海姆大学的Hans Meuer、美国田纳西大学诺克斯维尔分校的Jack Dongarra以及美国劳伦斯伯克利国家实验室的Erich Strohmaier与Horst Simon等人共同汇编。
“神威·太湖之光”是世界上首台峰值运算性能超过每秒十亿亿次浮点运算能力的超级计算机。该系统是我国“十二五”期间“863计划”的重大科研成果,由国家并行计算机工程技术研究中心研制,运算系统全面采用了由国家高性能集成电路设计中心通过自主核心技术研制的国产“申威26010”众核处理器。
“神威·太湖之光”也是我国第一台全部采用国产处理器构建的世界排名第一的超级计算机。
此外,2016年年底,被称为“高性能计算领域的诺贝尔奖”的“戈登·贝尔”奖公布获奖名单,依托于“神威·太湖之光”的强大计算能力,中国有3项应用入围最终提名,总的提名项目是6项。
2017年6月18日,新智元有幸走进国家超级计算无锡中心,近距离接触世界最快超级计算机“神威·太湖之光 ”。
新智元专访超算技术专家:神威·太湖之光凭什么能连夺世界第一
“神威·太湖之光”为什么能雄踞超级计算机全球榜单的第一名?新智元在国家超级计算无锡中心采访到超算技术专家。
这位全程参与“神威·太湖之光”的专家对新智元说,主要原因是:“神威·太湖之光”芯片的计算能力以及节电节能的水平,都是可以跟国际上最新的芯片相比的。他说:“这在以前是我们中国是想都不敢想的,‘神威’ 芯片结构设计有独创性”。
具体说来,国际上的GPU等芯片,过去都是采用插卡的形式,这样的芯片设计会造成几个问题:第一,组装规模大,费电;第二,PCE作为通信接口,造成瓶颈。太湖之光把运算控制核心与运算核心做在一个芯片内,这样就把这两个问题都解决了。
“在国际上,现在英特尔可能也正在推出类似芯片,这一点上我们是走在前面的”,超算专家说。
据介绍,“神威”的强大,还有一个原因是得益于国产的自主指令机,通过多年的积累,他们已经构建了从编译器、操作系统、开发环境到应用平台的较为完善的软件生态链。而且有针对硬件做性能的优化,确保性能的发挥,节能水平的利用。
从整体上看,“神威·太湖之光”在机房中的排列呈“010”的样式,这也正是计算机的语言。国家超算无锡中心的工作人员向新智元介绍说,“神威·太湖之光”总共有48个机柜,左右两边各20个,中间 8个。其中,每一个机柜有 1024个CPU,采用众核架构,每个CPU有四个主核,每个主核带有64个从核。主核负责分发任务,从核负责加速,“等于把CPU和GPU做在一起了”。
新智元在机房内感受到,机器发出的噪音并不大,只有整齐规律的一点声响,并且整体温度控制得很好,比机房外开着空调的会议室还要凉快。
相关负责人对新智元介绍说,整个“神威·太湖之光”每天消耗的电量是40万度,需花费20万人民币,一年下来电费成本在5000到6000万之间。
“神威·太湖之光”全面采用了自主研制的中国芯——“申威26010”众核处理器,这是一款具有独特性的处理器,它采用了片上融合的异构众核体系结构,以及具有自主知识产权的指令集和完整的配套软件生态系统。这种独特性的体系结构在5平方厘米的方寸之间集成了260个运算核心,数十亿晶体管,达到了每秒3万亿次计算能力,单芯片计算能力相当于3台2000年全球排名第一的超级计算机足以比肩当前超级计算机领域最先进的处理器。
每秒10亿次,这是一种怎样的运算能力?这意味着神威·太湖之光的计算能力200万台目前主流性能电脑的计算能力。神威·太湖之光在体系结构、高速互联、系统软件等关键技术上都实现了前所未有的创新和突破,带来了性能的跨越式发展。神威系列作为我国超级计算机国产化的主要推动者,以12.5436亿亿次的峰值性能和9.3015亿亿次的持续性能,站上了超级计算机领域的世界巅峰。
6月17日,根据《华尔街日报》的报道,美国能源部(DoE)及与其合作的 6 家硬件供应商将得到近 5 亿美元的资金,致力于研究、开发和部署 E 级(百亿亿次)计算项目。
据报道,美国能源部计划至少交付两个系统——2021年至少有1 个,之后或许还有两个或更多。 《华尔街日报》的新闻中直接将美国相关部门的这一举动描述为与中国争夺超算世界霸主地位的重要措施。
新智元在无锡也就中国超算接下来几年的发展请教了相关负责人。据介绍,我国的计划是在2020年交付第一台E级超级计算机,目前由科技部在支持这一项目,有三个团队在同时开展研究——神威、天河和曙光,但是明年会最终决定由1-2 团队来研发。据悉,国家对这一项目的投入超过30亿。
该负责人表示,我们认为,百亿亿级还有很大的难点,因为不是简单的堆砌就能完成的。不过,虽然有很大难点,但是,从太湖之光成功经验来看,他们对于百亿亿级还是很有信心的。
谈到神威的优势,相关技术人员在向新智元介绍时提到,去年发布 Top 100 榜单时,排在第一名的“神威”运算能力遥遥领先,超过2-5名的总和。这种优势也将有利于神威的研发团队角逐E级超算。
“神威·太湖之光”计算机系统面向工业设计、地球科学、天气气候、天文宇宙、航空航天、材料科学、生物医药、大数据、云计算和深度学习等领域提供计算和技术支持服务。
据介绍,神威深度算法库swDNN,基于申威异构众合处理器开发的神威深度学习算法库swDNN,可将“神威·太湖之光”发挥至60%的计算效率,充分发挥了“神威·太湖之光”在应用上的计算支撑作用,将极大的推动深度学习应用的快速发展。
该算法库由清华大学的相关团队开发和运维。
“神威·太湖之光”目前已经在多个课题上得到应用。
国家超级计算无锡中心副主任付昊桓将在本届的ISC上发表演讲。介绍神威超级计算机。
摘要
神威·太湖之光超级计算机是世界上第一个具有超过 100 PFlops 峰值性能的系统,以及超过1000万个处理器核的并行规模。与其他现有的异构式超级计算机(包括CPU处理器和PCle连接的多核加速器,例如NVIDIA GPU或Intel MIC)不同,太湖之光的计算能力由中国江南计算所开发的SW26010 CPU提供,该处理器包含MPE(management processing elements,管理处理组件)和CPE(computing processing elements,运算处理组件)。这个演讲将报告我们将超过1000万个处理器核的计算资源用在传统科学模拟应用(气候模拟,地震模拟,n体,CFD等),以及大数据分析应用(遥感数据处理,基于神威的深度学习框架等)中的最新进步。基于此,我们将尝试提出将新算法或现有软件映射到神威·太湖之光超级计算机上的主要挑战,以及该超算的主要优势。