200 多家明星企业,20 位著名投资机构顶级投资人共同参与!
「新智造成长榜」
致力于发掘 AI 领域有 “
三年十倍
” 成长潜力的创新公司,下一波 AI 独角兽,会有你么?
点击加入
!
雷锋网按:
日前,龙芯在发布会上发布了 3A3000 和一系列产品。而且发布会上还公布了龙芯开发者计划、龙芯高校计划、龙芯产业基金。不过,笔者本文介绍的是龙芯正在研发的下一代 CPU——3A4000。
龙芯 3A4000 的设计指标如何,要实现这个指标有何难度?龙芯 3A4000 性能会有哪些可能性呢?
关于 3A4000 的进度
关于龙芯 3A4000,龙芯对其寄予了厚望,特别是吸取了 3A2000 和 3A3000 的不足后,做了修改,而且改动比较大,龙芯方面最理想的目标是实现 GCC 编译器下 SPEC06 定点 20 分,不过这个是最理想状态下的。毕竟 CPU 公司跳票或者没能达到计划的情况很常见,即便是 Intel、AMD 都有这种黑历史。
先介绍一下 3A4000 的进度
。3A4000 的研发会比较慢,主要是两个目标定的很高,一个是 GCC 编译器下,SPEC2006 测试能达到 10/G,另一个是主频到 2G。
10/G 是什么概念呢?AMD 的 Zen 大概也就这个水平——AMD 自己公布的是 3.4G,31.5 分,换算以下就是 9.26/G。不过由于一些优化选项没开,而且编译器是 GCC4.6,换一下 GCC 编译器版本,多开一些优化,10+/G 的成绩 Zen 还是能达到的。
Intel 的 Haswell,像赛扬的话,因为没有 AVX 指令带来的向量优化,以及缓存被 “阉割” 等因素,也就 9.3/G,而 I5 4460 因为不像赛扬被 “阉割”,可以到 11/G,网友测试 Skylake,大约也就 11+/G(毕竟 Intel 这些年在挤牙膏)。
因此,如果龙芯 3A4000 能到 10/G,那在微结构上和 Intel、AMD 的差距就比较小了。不过,考虑到越往上走,微结构优化难度越大。像 3A4000 基本上是 3A3000 里一点一点的抠,因而要实现这一目标的难度很大。
难度到底有多大呢?作为参照,以 AMD 的实力憋出 Zen 都用了九牛二虎之力,而龙芯 3A3000 的微结构 GS464E 除了带宽是 K10 的两倍之外,总体上 GS464E 和 K10 相当。等于是龙芯要完成 AMD 从 K10 到 Zen 的跨越。
AMD 憋出 Zen 都用了这么久,龙芯要实现这一点,难度可想而知。
第二是主频
,龙芯 3A3000 主频上不去,固然有自身后端设计能力相对有限的因素,但也和人力、财力,以及和代工厂的能力息息相关。而境内的代工厂在同制程下只有台积电的 60%,和龙芯长期合作的 ST 在同制程下也只有台积电的 80%,而台积电和 Intel 又有一定差距。
另外,如果主频要做上去,IC 设计公司和代工厂就必须建立非常密切的关系,要开放一些技术资料,像 Intel 和曾经的 AMD、IBM 都是 IDM 厂商,因此可以开放技术资料设计和工艺制造不断磨合。虽然 IBM 和 AMD 把晶圆厂卖了,但依旧和 GF 保持了过去的密切联系,很多技术储备和资料也都保留了下来,这样就可以继续做高主频 CPU。但龙芯和 ST 不可能建立这种关系。
而境内的一些代工厂,在技术实力上还有待提高——境内工艺的一致性比境外工艺有一定差距,包括不同批次的一致性,仿真模型和实际晶体管参数的一致性都和国外工艺有一定差距,设计时要多留些裕量,蒙特卡罗仿真也要把参数波动范围设大一些。
龙芯 3A2000 在研制中就因为和境内代工厂磨合多耗费了 1 年时间,而在 ST 流片的 3A3000 则非常顺利了,从立项到流片也就用了 1 年时间左右。换言之,就是龙芯即便和境内代工厂建立了密切的合作关系,境内代工厂也只能说:臣妾做不到啊!
此外,微结构越复杂,后端设计压力就越大,比如像把 A53 主频做到 2G 和把 Zen 的主频做到 2G 完全不是一个档次的工作难度。像 3A4000 这种 CPU 的微结构,设计目标接近 Haswell 的东西,对于任何一家国内团队来说,后端设计难度都非常大,而且龙芯 3A3000 和龙芯 3A4000,还是使用同样的制造工艺,这样就不可能通过工艺的提升来提升主频,完全靠自身的设计能力把主频提升 30%,难度可想而知。
最后,虽然目前微结构优化的成果比较喜人,而且已经有仿真结果了。但由于要达到 2G 主频,最后可能会做一些权衡。最后能拿出怎么样的产品,只有等待时间检验了。
笔者做一个预测,龙芯 3A4000 可能会采用 ST 28nm FD SOI 工艺,如果抢时间的话,保守估计主频 1.8-2.0,SPEC06 GCC 编译器下定点 16-18 分。
如果多花费一些时间进行优化,而且龙芯团队发挥正常的话,3A4000 主频为 2G,SPEC06 GCC 编译器下定点 18 + 分。
如果龙芯团队超水平发挥,ST 也没有掉链子,也许能实现 GCC 编译器下 SPEC06 定点 20 分。
关于龙芯走自主道路和发展方向
必须强调的是,虽然网络上充斥着对龙芯各种不靠谱的报道,但龙芯对自己的能力,与 Intel、AMD 的差距认识的非常清楚。
在 2020 年前,龙芯主打方向是工控、网安,以及石油、电力、交通、金融等行业应用,这些行业应用一方面事关国家信息安全,另一方面在替换上不像桌面和手机存在庞杂的软件生态的问题。
对于龙芯的 PC,3A3000 主要针对的是党政军办公和龙芯爱好者、开发者。
龙芯既没有能力,也没有心思进军民用市场与 Wintel 一争高下。