百亿亿次级超级计算的3种实现途径

悦智网 · 公众号 · · 2017-12-05 15:25

正文

国际电信联盟

正在梳理实现

下一代移动标准的可能途径。

━━━━━

这10年来的大部分时间，高性能计算的专家们都将目光投向了百亿亿次级计算机，即每秒能够进行100亿亿次浮点运算的超级计算机。专家们表示，我们现在就到了可以制造这样一台计算机的时候了，只是成本高得离谱。

美国阿尔布开克的桑迪亚国家实验室先进设备技术部门的计算机工程师埃里克•德本尼狄克提斯（Erik DeBenedictis）表示：“我们今天可以建造一台百亿亿次级计算机，但可能需要一个核反应堆为其提供动力。这并不是不可能的；这只是个成本问题。”

虽然核反应堆是美国能源部的专长，但该部门的目标是，当百亿亿次级超级计算机在21世纪20年代的某一天首次上线后，利用的是更为温和的电力来源。它的目标是要这种计算机消耗的功率不超过20兆瓦。

自2012年以来，德本尼狄克提斯一直在与IEEE重启计算计划（IEEE Rebooting Computing）和国际半导体技术发展路线图（ITRS）合作，研究实现百亿亿次的可行之路。他认为，有三大技术可以推动其发展：毫伏开关、3D堆叠内存芯片以及专门的处理器架构。每项技术都涉及一些权衡，特别是在软件专业化的领域，而且很难预测这些技术何时能够被部署。

━━━━━

▍毫伏开关

按照摩尔定律，工程师们曾希望硅晶体管的工作电压继续随着晶体管体积的缩小而降低。但相反，一度稳步改善的工作电压在过去的10年里一直徘徊在1伏左右。

加州大学伯克利分校美国国家科学基金会的高能效电子科学中心主任、计算机工程师伊莱•亚波罗诺维奇（Eli Yablonovitch）表示：“我们理论上可以将现在约为800毫伏的工作电压降到几毫伏。”这样的“毫伏开关”将是超级计算机能效问题的一个一劳永逸的解决方案，但它仍然是一个难以实现的目标。

没有人知道毫伏开关如何实现，而更糟的是——从“不久后就要建造百亿亿次级计算机”的角度来看——没有人知道何时可以实现。但是亚波罗诺维奇的科学中心已经决定把重点放在4种可能性上。首先，有一种被称为隧道场效应晶体管（TFET）的设备：打开这个设备，晶体管两面之间的电子阻隔就会变得很薄，电子更有可能从“隧道”中穿过。第二种可能是节省电力的微型纳米电机开关，因为很少有电流可以通过打开的开关泄漏。第三，纳米光子学可以用光信号代替物理线路，实现开关之间更快、更低功耗的通信。第四，基于纳米磁学的逻辑电路可以为更低能耗、非易失性电路铺平道路。

亚波罗诺维奇创造了“毫伏开关”这个词来阐述“摩尔定律的能量版”深远的潜力。桑迪亚国家实验室的德本尼狄克提斯认为，它不会像摩尔定律那样产生那么大的影响，但即便如此，他估计，毫伏开关也可以将工作效率提高10~100倍。

▍3D内存

美国能源部预测的20兆瓦百亿亿次级超级计算机能够节约30%的内存功率预算。这一功率预算目标需要改进3D堆叠动态随机存取存储器（DRAM）的内存堆叠架构，使内存芯片塔更接近于计算机芯片的处理器单元。

这样的安排意味着单元之间的互连更短，以及在传输数据时电容和电阻之间的功率损失更少。更妙的是，它们还意味着更快的通信速度。

堆叠内存已经引起了计算机行业更广泛的关注。Tezzaron半导体公司的首席技术官兼工程设计副总裁罗伯特•帕蒂（Robert Patti）曾在美国政府超级计算项目中工作过，他表示，2011年之前，技术巨头只是认为它是个“不错的科学项目”，但此后，大型芯片制造商都开发了不同版本的3D堆叠内存，并使其商业化。

就其本身而言，Tezzaron公司开创了一种设计制造3D堆叠内存的方法，可提高内存性能，使得每个内存芯片层之间的互连密度更高，并降低了制造成本。

帕蒂说：“在很多方面，3D集成都使你可以做到鱼和熊掌兼得。你可以同时提升速度和降低功耗。”

帕蒂表示，百亿亿次级超级计算机可能需要减少对易失性DRAM（即只有在通电时才可以保存数据的计算机内存）的依赖，而更多地使用存储速度更快的非易失性电阻式随机存取存储器（RAM）。随着内存访问延迟的变化，一个基于3D内存堆叠的新架构也需要进行一些软件的重新调试。但德本尼狄克提斯表示，这些工作一旦完成，利用更多的内存将100亿亿次浮点运算的超级计算机升级到200亿亿次、300亿亿次或400亿亿次不会使系统消耗更多的功率。

▍专业芯片架构

在只能运行少数特定应用的计算机处理器上添加专门的内核，可帮助节省超级计算未来的功率预算。只有在需要特定功能的时候，芯片的各个部分才会全功率运行，不需要时则会断电。

但是，这种专门的架构还需要程序员定制软件来充分利用增加的效率，并且这会限制特定的超级计算机可高效执行的任务。

德本尼狄克提斯表示：“如果你想要别的东西，你必须用一个新的设计来替换芯片。”他认为，这种专门的结构将有可能成为百亿亿次级超级计算机的一部分。随着生产芯片的成本不断下降，利用具有专用功能的专业芯片建造出通用的超级计算机可能是可行的。

作者：Jeremy Hsu

>>>本文为原创，转载请回复。<<<

往期推荐

中国走向百亿亿次级计算

潮湿的计算：液控二氧化钒开关可能具有媲美大脑的工作效率

研究人员全力发掘可逆计算，将其投入使用的时机已经到来