近年来,我们很欣喜地看到中国的处理器产品有了巨大的进步——从嵌入式领域、安全应用、服务器领域到超级计算应用,国产处理器的身影无处不在。但有所遗憾的是,之前的国产处理器大多应用在非常专业的领域,一般很少涉足个人应用。因此为了让普通人也能用到国产处理器,在经过长期的战略规划、技术研发准备后,我国的科研人员终于推出了多款针对办公、影音播放、数据存储,可以运行在包括Windows、LINUX和大部分国产操作系统下的X86 CPU:兆芯。这意味着中国也有了与英特尔酷睿、AMD FX系列在技术架构、应用功能相似的X86处理器产品。那么我们的X86处理器具备怎样的技术水平呢?
此次开发中国X86 CPU来自一家新兴企业——上海兆芯集成电路有限公司。该公司是一家成立于2013年4月的国资控股企业,其主要业务是为业界提供满足国家战略需求、高性能、低功耗、低成本的芯片及配套解决方案。
兆芯之所以会将CPU作为主营业务,是因为兆芯承接了“核高基”国家重大专项,肩负着打造国产桌面通用处理器的重任。处理器是计算机、服务器等设备的核心,把这个“核心”牢牢把控在自己的手里,继而推动电脑、服务器等设备的全面国产化,服务国家互联网和信息化产业建设,是“核高基”重大科技专项立项的目的所在。
在兆芯公司成立时的2013年,我们国家已经有了基于多种架构的国产处理器,比如采用MIPS架构的龙芯,采用Alpha 21164架构的申威处理器。基于不同架构的处理器,它们的应用领域也不同,不同架构的国产处理器在各自的领域都已经有了显著的成绩,这是整个行业值得庆幸的事情。
但是,X86架构的CPU在桌面办公领域占据绝对核心的地位,政府、企业办公都脱离不了X86整机和服务器。这种庞大的用户规模、突出的平台兼容性让X86架构的这种地位在很长时间之内很难被撼动。然而以前我国没有自己的X86架构处理器,几乎全部要依赖进口。这不仅是我国集成电路产业发展的痛处,还会影响到我国的网络信息安全。因此兆芯公司选择专注X86架构,这不仅仅是看中了其庞大的用户规模和完善的平台、生态,更重要的是能为国家信息产业发展、以及需要网络信息安全的国家战略规划做出贡献。
在经过数年的潜心研究后,兆芯成功地迈出了X86高端通用芯片的国产化步伐。自2014年首次推出基于X86架构的ZX-A双核处理器后,兆芯接下来完成了ZX-C四核处理器的全新架构和代码设计,并于2015年实现了ZX-C四核处理器的量产。同时,兆芯处理器也逐步建立了完善的产品体系以及可持续性的发展策略。其中ZX-C已由单一的处理器进化为“开先”系列,包括ZX-C四核和ZX-C+四核两类处理器,两者均基于28nm工艺,主频最高2.0GHz,兼容X86指令集,支持CPU虚拟化技术,ZX-C+四核处理器还支持SM3和SM4高速国密算法指令。高速国密算法指令是由兆芯自主研发的一套算法指令集,不仅能大幅提升SM3和SM4两种国密算法的运算速度,还让密码学相关应用的开发以及部署和推广更为方便,这是市面上其他国外X86处理器所不具备的。
▲兆芯ZX-C处理器内部架构图,四颗核心清晰可见。
▲兆芯ZX-C四核心处理器,采用28nm CMOS工艺打造,尺寸为21mm×21mm的FBGA封装技术。其CPU核心采用超标量、多发射、乱序执行架构等设计,兼容X86指令,可支持原生64bit系统,并支持CPU虚拟化(VT)技术。
▲ZX-C处理器型号、技术规格一览,可以看到其四核心、四线程设计、28nm生产工艺已与当前的主流X86处理器相差不大,也支持SSE 4.2、AVX、AVX2等常用指令集。不足是其处理器频率稍低,内存控制器、PCIe控制器仍采用独立于CPU之外的设计,均集成在主板北桥芯片组内部,通过FSB总线与CPU通信。
对于一般消费者来说,他们是用不到SM3、SM4国密算法的,该算法主要嵌入到商业、电信、金融应用中,并在这些应用建立通讯信道的时候,启用这两种加密算法。而在计算机应用中,国密算法则是主要保护那些按保密法规定、涉及机密的文件、党政机关文件,以及来自电子政务网的文件传输都会采用类似加密。传输的时候软件自己就会进行加密,再到另一端进行解密。但是如果处理器不支持SM3、SM4算法指令集,那么它们就会用软件加速进行加密、解密,速度会很慢。兆芯的ZX-C+处理器由于在硬件设计上先天就支持SM3和SM4高速国密算法指令,因此其加密、解密速度会明显快于普通X86处理器,从而有效提高办公效率。
根据兆芯在首都网络安全日系列活动期间的现场演示来看,在使用高速国密算法指令的情况下,SM3的计算速度在3200Mb/s以上,SM4的计算速度也有近2400Mb/s的高水准表现,兆芯表示这一成绩领先其他国际主流通用处理器平台2倍以上,这也是这款国产处理器所拥有的最大优势。
同时,兆芯还在四核处理器的基础上打造出了“开胜”系列,即ZX-C+八核处理器。规格方面,开胜系列处理器为28nm工艺,主频2.0GHz,支持CPU虚拟化技术和高速国密算求的产品或应用领域,如兆芯多次展出的国产化云计算解决方案。基于开胜系列处理器打造的国产化云计算解决方案支持自动化部署,能够为超融合系统提供基础架构,支持构建基于Windows或者LINUX的云服务,并且具备按需扩展和灵活配置特点,能够大大降低搭建成本。
▲ZX-C+处理器分为四核心、八核心两种,与ZX-C处理器相比,ZX-C+处理器增加了对SM3、SM4国密算法的支持。
值得一提的是,兆芯也为CPU发展出了配套的Elite图形处理器,并集成在主板芯片组里。兆芯认为Elite图形处理器的性能基本达到了英特尔桌面产品HD GRAPHICS的水平,部分性能优于它。其主要特色在于内置了很多硬解码的功能模块,嵌入了众多的音视频解码功能,可以轻松播放各类1080p全高清视频,当前兆芯处理器的Elite图形核心已经被移植到了全上海的机顶盒里,也从侧面证明它具备优异的视频播放性能。而在下一代兆芯处理器上,据悉兆芯会将图形处理器集成在处理器内部,继续提高流处理器、TMU贴图单元、ROG光栅处理单元的规模,从而增强图形处理器的3D性能。当然要玩大型3D游戏的话,兆芯还是建议用户采用独立显卡,16nm图形处理器最突出的特色是其媒体播放功能会进一步增强,可以支持HDMI 2.1,并拥有流畅播放4K视频的能力。
▲已经问世的各款兆芯处理器与主板芯片组——其中ZX-A是兆芯较为早期的产品,ZX-B采用与ZX-A相同的微架构,但在国内代工流片。ZX-C与ZX-C+开先系列四核心处理器采用了新一代微架构,是目前的主力产品。代号为FC-1080的ZX-C+开胜处理器是一款面向服务器的八核心处理器,而ZX-100S则是为以上CPU设计的配套主板芯片组。
此外,兆芯也为开先和开胜两大系列的ZX-C、ZX-C+处理器研发了最新的配套芯片组—兆芯ZX-100S。它支持双通道、最大64GB DDR3 1600标准电压或低电压内存,集成图形处理器,支持DP、HDMI等高清输出标准,具备USB3.0、SATA 3.0等常用接口,达到了国际主流水准。
虽然处理器是电脑的核心,但仅有一颗芯片成不了气候,企业的成长需要和产业内商业伙伴进行通力合作。目前兆芯已与国内行业领军企业,在操作系统、工艺、固件、整机、嵌入式工控、网安等领域通力合作,共同构建了一条从芯片研发生产、到硬件整合、到系统集成,再到应用和服务的完整国产化产业链。如兆芯与联想通力配合,建立了首个符合国际标准的国产CPU整机生产线,并在该生产线上开发出多款不同形态的联想兆芯整机产品;包含中科方德、中标麒麟、普华在内的多家操作系统厂商,以及中电昆仑、百敖等国产定制BIOS提供商也均与兆芯达成了战略合作。
此外,WPS、达梦等软件开发商,研祥、上海仪电等工控设备厂商,联想、火星高科、天地超云等服务器厂商以及网安领域领头羊天融信,均在国产化产业链中与兆芯进行了深度的合作并推出成型案例。
▲频率为2.0GHz的兆芯ZX-C处理器在Windows7操作系统中可以被正确识别出型号。
在兆芯与行业龙头企业共同构建的国产化产业链内,除了国产化电脑等设备的设计生产和系统集成,兆芯和产业链伙伴还在提升办公设备、应用软件的兼容性,以及完善服务和扩展应用领域方面不断努力。国产化办公电脑现已支持总计1000余款外设产品和5000余款应用软件,服务体系囊括11000多名产品服务工程师,覆盖全国超过2000个县级城市。
最后,兆芯协同产业链伙伴在市场化方面也取得了一定的成果。兆芯ZX-C处理器自2015年4月量产以来,在桌面电脑领域,兆芯ZX-C处理器已被联想、同方、仪电等国内整机厂商采用。基于兆芯ZX-C处理器的联想开天M6100台式机、开天A6100一体机、昭阳CF03笔记本等产品已经通过了国家强制性3C认证、能效一级认证以及中国节能认证、绿色环境标志认证,并正式入围政府采购的节能产品目录和绿色环境标志产品目录。
▲采用开胜ZX-C+八核处理器的联想通用服务器(上)与火星高科存储服务器(下)。
▲多款使用兆芯X86 CPU的整机系统,显示出兆芯得到了众多整机厂商的支持。
▲在近期举办的第四届中国科技城国际科技博览会,兆芯展出了多款采用兆芯处理器的整机产品,如这款采用中科方德操作系统的联想开天A6100国产一体机。
▲上海仪电生产的Biens微型台式机,可以采用Windows 7操作系统,并流畅播放各类1080p全高清视频。
目前,应用兆芯国产X86通用处理器的整机已先后在上海市所属的近400家单位正式应用,用户的实际应用,包括电子政务系统、WPS办公、预算申报系统、网页浏览、视频播放等,总体试用情况获得了良好的反馈。同时,应用ZX-C的整机目前已在党政军办公和信息化等国家重点系统和工程中得到实际应用,并获得了“性能良好,质量可靠,能够满足实际工作需要”等反馈。
综上所述可以看到,我国的兆芯X86处理器不仅拥有四核心、八核心等多核设计,还得到了众多厂商的支持,同时也得到了党政机关、国家企事业单位的广泛采用。那么兆芯处理器未来还会有怎样的发展呢?我们普通老百姓是否也能用上兆芯处理器?兆芯是否也会推出与英特尔、AMD类似,没有焊接在主板上,采用插针式封装、可供用户自由选择的处理器?
为此,MC小编特别对上海兆芯集成电路有限公司副总裁傅城博士进行了专访。
MC:请问兆芯处理器有无考虑进入消费级市场的计划,即像AMD、英特尔的消费级处理器那样在零售端市场去销售?
傅城
目前兆芯整机暂时主要面向政府、企事业单位办公的主要原因在于办公用机的用途相对不复杂,可以较为容易地进行优化。从功能上来看,兆芯处理器实际上已经完全可以进行视频播放、游戏、上网等应用。
然而由于消费类软件的组成是五花八门,需要做多种优化,如调校软件和驱动,时间与准备期一般比较长。如果处理器没有做相应的优化,在这些应用中虽然可以使用,但在一些应用中难免会有出问题的潜在可能性。因此在消费级市场,兆芯还需要与上游软件厂商做匹配工作,需要较长的时间。我们会等到与软件厂商的磨合足够,练好内功后,再大力在消费级市场进行推广。不过为了满足那些对硬件感兴趣的玩家,我们会计划首先针对DIY玩家推出一些兆芯产品。
MC:从现在来看兆芯处理器采用的是FBGA封装的,缺乏灵活性,那么兆芯未来会不会为DIY玩家推出采用SOCKET LGA插槽式封装,把处理器和主板分开来销售的产品呢?
傅城
我们会有这种计划,就是面向DIY玩家,可以让DIY玩家能更多地使用兆芯,进行测评,也有助于兆芯的发展。之前我们之所以采用FBGA封装,是因为初期的兆芯处理器主要面向办公用机,可以起到降低成本,提高可靠性的作用。
在未来的DIY市场,兆芯会推出插槽类产品,当然我们的插槽会与AMD、英特尔的有所不一样,毕竟每种插槽都有自己的专利,我们会发明自己的插槽接口。兆芯未来也会非常重视DIY市场,专业级玩家多了,对兆芯也是一种很好的推广作用。
MC:目前兆芯的生产工艺已经是28nm了,达到不少消费级处理器的水平,那么兆芯使用的是哪家的28nm工艺?兆芯的生产工艺未来有没有明确的推进计划?
傅城
兆芯的28nm工艺是从2013年做预研,2014年开始正式设计,去年完成量产的。它的28nm工艺来自台积电,同时大陆华力微电子也在对28nm兆芯进行研发,明年也可实现28nm量产并为我们供货,所以兆芯处理器的生产是毫无问题,且有坚实保障的。
同时,为下一代兆芯处理器开发的16nm生产工艺也从2015年年末就开始预研,预计明年流片, 2018年实现量产,未来16nm的兆芯处理器生产也主要会来自这两家厂商。
MC:目前兆芯CPU的频率在1.2GHz~2.0GHz左右,功耗也比较低,最高甚至不超过35W,那么如果将功耗提升到与同级28nm处理器相当,兆芯的频率是否能做得更高?
傅城
兆芯目前在28nm产品上没有进一步的频率提升计划,而在16nm上则会考虑。第一步预计先提高到2.5~3.0GHz,后续会不会加入自动超频技术,不仅要看设计上的改善,还要看制造公司在生产工艺上能做多大程度的改善与配合。对兆芯来说提升频率将是个挑战,但我们现在也已经做了很多技术预准备工作,有信心实现这个目标。
MC:从技术规格来看,目前兆芯ZX-C、ZX-C+处理器搭配的VX11PH、ZX-100S芯片组还采用了传统的南北桥设计,请问下一代兆芯处理器在这方面是否会做出改良?
傅城
为了实现更高的传输效率、降低延迟,提高性能,在下一代代号为ZX-D、ZX-E的16nm兆芯处理器上,我们会将前面提到的图形GPU,以及DDR4内存控制器、PCIe控制器与其他一些高速接口统统都集成在处理器内部。届时主板就只剩一块集成SATA、USB、基带等低速接口的南桥芯片了,可以说那时兆芯的体系架构将完全追上国外的处理器平台架构。
另一方面,虽然VX11PH与ZX-100S主板芯片组采用的还是南北桥设计,但最新的ZX-100S在功能上会有所提升。如ZX-100S可以支持PCIe 3.0、USB3.0、SATA 6Gbps等当今主要传输总线与存储技术,其规格也追上了当前主流主板的水平,已可以用于服务器、数据中心等对存储性能要求较高的平台。在下一代主板上,兆芯还会带来更多的惊喜。
MC:现在VR虚拟现实技术越来越火,请问兆芯处理器能否满足当前最流行、最火热的VR应用?
傅城
在这里可以透露,实际上我们现在已经开始了与HTC的合作,将为HTC VIVE虚拟现实设备研发一种类似机顶盒的小型解决方案。这个VR盒子可以让用户在Windows操作系统下运行各类VR游戏,它的作用主要是处理游戏中的交互数据,传输媒体流,重活则交给远端的计算机,头盔则用于展示立体场景、游戏效果,可以以更低的成本满足玩家体验VR游戏的需求。
MC:我们在兆芯的ROADMAP路线图上看到了下一代代号为“WUDAOKOU”的处理器,但却没有任何具体信息,请问能否透露一下它的技术水准?
傅城
“WUDAOKOU”实际上只是内部处理器架构的一个名称。目前来看ZX-C处理器、ZX-C+处理器都已经实现了量产,后缀有“+”的处理器说明它与原型处理器都使用的是一代工艺,改善的主要是核心的数量,或者对一些新的应用软件进行优化。一般来说“+”系列可以面向更为高端的应用,而原型处理器则主要针对个人应用。预计在后年2018年问世的下一代ZX-D处理器则会在架构、工艺、指令发射数量、核心的结构上都做出重大变动。
MC:我们知道像CPU厂商英特尔有一个TICK-TOCK这样的发展规划,即第一年推出工艺改进的产品,第二年推出架构大改的产品,请问兆芯当前有无类似发展策略?
傅城
当然,为了保证兆芯处理器能够不断地可持续发展,我们也有类似的发展策略。当前兆芯有两支团队,其中一支主要进行架构上的更新、验证,架构上的设计工作更新完后,再将它的研发成果交付给另一支产品组,产品组就会着手对这个技术成果进行产品化。而架构组就开始进行下一代架构的预研,也就是说新架构交付的时候,我们就可以做下一代设计,架构的升级周期差不多在一年到一年半,产品的换代周期差不多在一年。也就是说同一代架构可以衍生两代产品,产品差不多两年换一次架构。其工艺、架构的更新频率与TICK-TOCK非常相近。
MC点评
坦率地说,就当前产品来看,兆芯处理器同世界两大X86 CPU厂商的产品相比还有些差距,但对于中国来讲,兆芯的问世,意义却十分重大。
首先在核心芯片设计研发方面,兆芯是目前国内唯一掌握处理器、配套芯片组和图形处理器三大核心技术的公司,掌握着三大核心芯片共计480万行代码,芯片的设计研发全部由本土员工组成的技术团队在国内完成,实现了全部研发环节的透明可控。
更为关键的是,兆芯处理器支持国外处理器所没有的国密算法指令集,可以轻松快速地对涉密文件进行加密或解密,拥有任何一款国外处理器都无法替代的安全性能。而且,兆芯处理器不只是待在实验室里,更得到了上海市所属近400家单位,以及党政军办公和信息化等国家重点系统和工程中的应用,并获得了大量整机厂商的支持。
随着兆芯技术的不断发展,相信兆芯不仅将继续在专业市场获得优异的表现,在消费级CPU市场上,兆芯也将成为用户一个可以考虑的选择。