专栏名称: 芯师爷
最及时且有深度的半导体新媒体。每日解读半导体科技最新资讯、发展趋势、技术前沿信息,分享产业研究报告,并打造中国最大的半导体社群与生态圈,欢迎加入半导体专业人士的圈子!旗下更多订阅号:今日芯闻、全球物联网观察。
目录
相关文章推荐
中国能源报  ·  关于举办绿电、绿证、CCER交易培训的通知 ·  昨天  
中国能源报  ·  关于举办绿电、绿证、CCER交易培训的通知 ·  昨天  
南方能源观察  ·  深化新能源上网电价市场化改革正当其时 ·  昨天  
能源电力说  ·  海博思创+亿纬锂能,三年50GWh! ·  2 天前  
能源电力说  ·  海博思创+亿纬锂能,三年50GWh! ·  2 天前  
南方能源观察  ·  储能安全警钟长鸣 ·  3 天前  
51好读  ›  专栏  ›  芯师爷

35款经典CPU带你回顾英特尔的成长轨迹(上)

芯师爷  · 公众号  ·  · 2017-10-24 18:24

正文


英特尔已称霸半导体业多年, CPU 无疑是其安身立命之本。

眼下在非移动处理器市场风光无限的英特尔,其实也有着发展路上苦涩的经历,各种成功、失败、喜悦、沮丧,汇集在一起,才使得这位行业大佬发展到今天这样的位置。

下面,小编就带你梳理一下该公司历史上的 35 款经典芯片,看英特尔 CPU 的发展都经历了哪些鲜为人知的故事,也看看它走麦城时候的样子。

始于 4004


1971 年,英特尔第一款微处理器——四位的 4004 面世,它与其他三个芯片配合工作,分别是 4001 ROM 4002 RAM ,以及移位寄存器 4003 。而 4004 负责进行计算。当时, 4004 在计算器和类似的设备中大量采用,但还未能应用于计算机中,它的最大时钟速度为 740 kHz



4004 之后,一款类似的处理器出现了,称为 4040 ,它基本上是一款扩展的指令集和更高性能的改进版本的 4004


8008 8080


4004 打响了英特尔微处理器业务的第一枪,随后,英特尔推出了全新的八位处理器, 1972 年, 8008 诞生,紧随其后的是 1974 年的 8080 1975 年的 8085 8008 是由英特尔生产的第一款八位处理器,值得一提的是, 8080 的速度比 4004 快,这得益于其八位处理数据的能力,但它的时钟频率偏保守,在 200kHz~800kHz 之间, 8008 的性能没有能够吸引多少系统开发商。 8008 使用 10 微米晶体管制程技术。


8080 则较为成功。它在 8008 基础上加入了新的指令,并过渡到了 6 微米的晶体管制程。这使其时钟速率提升了一倍以上, 1974 年,最高性能的 8080 芯片运行在 2 MHz 8080 被应用到了很多设备当中,这导致一些软件开发商,如那段时间刚成立的微软,开始关注适用于英特尔处理器的软件开发。

8086 发布时,它是基于 8080 ,并保持软件的向后兼容性。 8080 和关键硬件因素已出现在所有基于 x86 处理器的生产当中, 8080 的软件可以运行在任何 x86 处理器上。

8085 是一个不太昂贵,且时钟频率更高的变种 8080

8086 x86 的开始


英特尔首款 16 位处理器是 8086 ,相比以前的设计,提高了性能。它不仅是主频高于 8088 ,还采用 16 位外部数据总线和一个 6 字节的预取队列。它也能够运行 16 位的任务(尽管大多数软件是专为八位处理器设计的)。地址总线扩展到 20 位,使 8086 可以访问 1MB 内存,性能明显提高。


8086 成为了第一个 x86 处理器,它使用了 x86ISA 的第一次修订,后来,几乎所有由英特尔和 AMD 开发的处理器都是建立在 8086 基础之上的。

英特尔在同一时间还推出了 8088 。该处理器是基于 8086 的,但是有很多数据线和四字节的指令预取队列都减半,这导致失去平衡,为窄总线切取指令率,迫使其执行单元空闲的时间不多。它具有 1MB RAM ,比以前的处理器更高的频率,但它比 8086 慢一点。

80186 80188


英特尔跟进 8086 与其他几个处理器,所有这些都使用了类似的 16 位架构。第一次是在 80186 上,针对嵌入式应用。为推动这项工作,英特尔将主板上的一些硬件进了 CPU ,包括时钟发生器、中断控制器、定时器。对某些指令,即使在相同的时钟频率, 80186 8086 跑得快得多。当然,英特尔自然会提升 CPU 的频率,以进一步提高性能。


80188 同样把一些硬件功能块集成了进去。但同 8088 一样,其数据总线减少了一半。

80286 :更多的内存,更高的性能


80286 80186 在同一年发布,性能几乎相同,但它的扩展地址总线为 24 位,使处理器能够访问到 16MB 内存。


iAPX 432


iAPX 432 是英特尔早期尝试从 x86 投资组合中脱颖而出的一种完全不同的设计。 英特尔预计 iAPX 432 比其他产品快几倍。然而,该款处理器最终失败了,原因在于一些设计缺陷。虽然 x86 处理器相对复杂,但 iAPx 432 CISC 带到了一个全新的复杂程度。硬件设计相当大胆,迫使英特尔将其从两个独立的 die 中进行制作。该处理器如果没有极高的带宽,则表现不佳。 iAPX 432 的性能超过了 8080 8086 ,但是它很快就被较新的 x86 产品超过了,因此,最终被放弃了。



i960 :英特尔的第一个 RISC 处理器


英特尔在 1984 年推出了其第一个 RISC 处理器。它不是 x86 处理器的直接竞争对手,因为它是作为一个安全的嵌入式解决方案。它使用伯克利 RISC 设计概念的 32 位超标量架构。第一款 i960 处理器的时钟频率相对较低,其中最慢的模式运行在 10 MHz ,但多年来,它被改进,并转变为使用更高的制程,使其达到 100 MHz 。它还支持 4GB 的受保护的内存。

i960 被广泛应用在军事和商业系统。

80386 32 x86 处理器


英特尔的第一个 32 x86 处理器是 80386 ,发布于 1985 年。该处理器有一个关键的优势是它的 32 位地址总线,可以支持高达 4GB 的系统内存。虽然这远远超过所有人的使用需求,内存限制往往伤害现有 x86 的性能和竞争处理器。与现代 CPU 不同的是,在 80386 发布的时候,更多的 RAM 几乎总是转化为性能提升。 英特尔还实施了几个架构增强功能,可以将性能提升到 80286 以上,即使两个系统都使用相同的 RAM 数量。它还支持虚拟模式处理,从而增加了多任务支持。


为了更经济的分割其产品阵容,英特尔还推出了 80386SX 这个处理器与 80386 几乎相同,它仍然采用 32 位架构,但其数据总线的一半被削减到 16 位,以节省成本。

i860


1989 年,英特尔又试图摆脱其 x86 处理器,它推出了一个称为 i860 的新 RISC CPU 与早期的 i960 不同,该 CPU 被设计为在桌面市场上竞争的高性能模型,但设计证明是有问题的。 其最重要的缺陷是处理器的性能完全依赖于编译器,按照在软件首次创建时需要执行的顺序放置指令, 这有助于英特尔保持芯片尺寸和 i860 的整体复杂性,但是在编译程序时,几乎无法正确列出从开始到结束的所有指令,这导致 CPU 在尝试解决问题时不断停止工作。


80486 :集成 FPU


英特尔的 80486 在性能方面又是一个重大的进步。 其成功的关键是将组件更紧密地集成到 CPU 中。 80486 是第一个包含 L1 缓存的 x86 CPU 早期的 80486 型号带有 8KB 的裸片,并在 1000nm 工艺上刻蚀。 但随着设计转变为 600nm L1 缓存大小翻了一番,达到了 16KB


英特尔还将 FPU 整合到 CPU 中,到目前为止,这是一个单独的功能处理单元。 通过将这些硬件移动到主机处理器中,它们之间的延迟急剧下降。 80486 还使用更快的 FSB 接口来增加带宽,并且核心有各种其他调整推动 IPC 这些变化显着提高了 80486 的性能,高端机型比旧式 80386 快了多倍。

第一个 80486 处理器达到 50 MHz ,后来使用改进的 600nm 工艺的型号高达 100 MHz 为了针对经济型用户,英特尔还发布了一款名为 80486SX 80486 版本,其中 FPU 已被禁用。

P5 :第一个奔腾处理器


Pentium 1993 年出现,是第一款不遵循 80x86 号码系统的 Intelx86 处理器。 在内部, Pentium 使用了 P5 架构,这是英特尔首款 x86 超标量设计。 虽然奔腾的速度一般比 80486 快,但其最突出的特点就是 FPU 大大提高。 原始奔腾的 FPU 80486 的老化单位快十倍以上。 这在英特尔发布奔腾 MMX 的后期几年中变得更加显着。 这款处理器在架构上与原始 Pentium 相同,但支持英特尔新的 MMXSIMD 指令集,可大幅提升性能。

英特尔还相对于 80486 增加了奔腾处理器的 L1 缓存。初始 Pentium 包含 16KB ,而 Pentium MMX 则上升到 32KB 当然,这些处理器也以较高的时钟速率运行。 第一台 Pentium 处理器使用 800nm 晶体管制程,可能只能达到 60 MHz ,但随后转变为英特尔 250nm 工艺,并将频率推高至 300MHz

P6 Pentium Pro


英特尔计划以 Pentium Pro 为基础的 P6 架构快速跟随奔腾,但遇到了技术难题。 由于其无序( OoO )设计, Pentium Pro 32 位操作中比 Pentium 快得多。 它具有重新设计的内部架构,将指令解码为微操作,然后在通用执行单元上执行。 由于附加的解码硬件,它还使用了显着扩展的 14 级流水线。

由于第一款 Pentium Pro 处理器面向服务器市场,英特尔将地址总线再次扩展到 36 位,并增加了 PAE 技术,使其能够支持高达 64GB RAM 这远远超过一般用户的需求,但是能够支持更大量的 RAM 是英特尔服务器的关键。


处理器的缓存系统也被重做。 L1缓存限于两个分段的8KB缓存,一个用于指令,一个用于数据。为了弥补与Pentium MMX相比的16KB的缺陷,英特尔在附加到CPU包的单独芯片上放置了256KB和1MB的L2缓存。它使用背面总线(BSB)连接到CPU。

英特尔最初计划将Pentium Pro推向消费者,但最终将其限制为服务器产品。 Pentium Pro具有几项革命性的功能,但在性能方面却与Pentium和Pentium MMX相悖。在16位操作中,较早的Pentium部件都显着增加,16位软件在当时仍然被大量使用。处理器也不支持MMX指令集,这导致奔腾MMX在MMX优化软件中表现优于Pentium Pro。

Pentium Pro可能在消费市场上有机会,但由于包含L2缓存的独立芯片,生产成本也相当高昂。 最快的PentiumPro处理器的运行频率为200 MHz,采用500到350nm之间的晶体管制程。

P6 :奔腾 II


英特尔并没有放弃P6架构,而是等到1997年发布了Pentium II。奔腾II设法克服了Pentium Pro几乎所有的负面因素。其基础架构与Pentium Pro类似,并且继续使用一个14阶段的管道,对内核进行了几项改进,以改进IPC。 L1增长到16KB数据+ 16KB指令高速缓存。

英特尔也转移到更加经济实惠的高速缓存芯片,连接到更大的硅封装以降低生产成本。这是使Pentium II成本更低的有效方法,但这些内存模块无法以CPU的速度运行。相反,L2缓存以半频率运行,而这些早期的处理器足以提高性能。



英特尔还增加了对MMX指令集的支持。 Pentium II内部使用的代码为“Klamath”和“Deschutes”的CPU内核也被销售为服务器的至强和奔腾II Overdrive产品。最高性能型号包含512KB的L2缓存,运行频率为450 MHz。

P6 1 GHz 的奔腾 III


英特尔计划使用基于其Netburst架构的处理器来跟踪奔腾II,但尚未准备好。相反,英特尔将P6架构再次推出为Pentium III。

这些处理器中的第一个代号为“Katmai”,与Pentium II非常相似,因为它使用了一个含有低质量二级缓存的插槽式墨盒,占据CPU速度的一半。底层架构纳入其他重大变化,因为14级管道的几个部分融合在一起,将其缩短到10个等级。由于更新的管道和时钟速度的提高,奔腾III处理器中的第一个处理器通常以小幅度优于其Pentium II对手。


Katmai使用250nm晶体管制程。 然而,随着迈向180nm制造工艺,英特尔能够显着提升Pentium III的性能。这个更新的实现,代号为“Coppermine”,将L2缓存移动到CPU中,并将其容量减少一半(低至256KB)。但是由于能够以处理器的频率运行,性能仍然高涨。

Coppermine是英特尔与AMD Athlon的竞争产品,在竞争中打破了1GHz。 英特尔试图生产1.13GHz的型号,但是汤姆硬件公司的Tom Pabst博士调查发现,这是不稳定的情况后,最终才被召回。这使得1 GHz型号成为最快的Coppermine Pentium III。

Pentium III内核的最后一个命名为“Tualatin”。 它采用130nm工艺,时钟频率高达1.4GHz。 它还将L2缓存增加到512KB,这有助于提高性能。

P5 P6 :赛扬和至强


在奔腾II发布之前,英特尔还推出了其Celeron和Xeon产品系列。这些产品使用与Pentium II或Pentium III相同的内核,但具有不同数量的缓存。基于Pentium II的第一款Celeron品牌处理器根本没有二级缓存,导致了可怕的性能。与Pentium III相比,之前基于Pentium III的型号的二级缓存的一半禁用。这导致Celeron处理器使用的Coppermine内核只包含128KB的L2缓存; 基于Tualatin的后期模型将其增加到256KB。


这些半高速缓存衍生产品被称为Coppermine-128和Tualatin-256。英特尔以与Pentium III相当的时钟速度出货,这使得他们表现良好,使其对AMD的Duron处理器具有很强的竞争力。微软使用了以733 MHz为单位的Coppermine-128 Celeron处理器,作为Xbox游戏机的CPU。

第一个Xeon处理器类似,但它们包含更多的L2缓存。基于Pentium II的至强处理器至少包含512KB,与Pentium II CPU相同,而高端机型则可能高达2MB。

Netburst


在讨论英特尔Netburst架构和奔腾4之前,重要的是要检查其深层流程背后的想法,该思路描述了指令通过核心的过程。线程通常执行多个任务,但有时它们专门用于单个功能。通过添加新硬件或将一个线程分为多个线程,可以扩展执行通道。处理器流水线也可以通过删除硬件或将多个组件下载到单个线程来缩小。


管道的长度或深度对延迟,IPC,时钟速度和架构的吞吐量有直接影响。较长的管道通常需要大量的带宽,但是如果流水线保持适当的数据馈送,那么管道中的每个阶段都保持忙碌状态。具有更长管道的处理器通常能够以更高的时钟速率运行。

在处理器内部的权衡是更高的延迟,因为流经它的数据必须在每个阶段停止一定数量的时钟周期。使用长管道的处理器也倾向于具有较低的IPC,这就是为什么它们依靠更高的频率来提高性能。多年来,执行这两种理念的处理器已经证明是成功的。

Netburst :奔腾 4Willamette Northwood


在2000年,英特尔的Netburst架构终于准备好了,并被推出了奔腾4。这个组合将在未来六年内领衔英特尔的高端CPU。第一个被命名为“Willamette”,它在其生命的头两年承载了Netburst和Pentium 4。然而,这对英特尔来说是一个困扰的时期,芯片的竞争力超过奔腾III。 Netburst能够显着提高频率,Willamette设法达到2 GHz,但在某些任务中,1.4 GHz的Pentium III仍然更快。AMD的Athlon处理器在此期间表现良好。

Willamette的问题是,英特尔将管道延伸到20个线程,并计划获得超过2GHz的时钟频率,但由于功耗和散热问题,它无法实现这些目标。英特尔的130nm设计被称为“Northwood”,情况有所改善,扩大到3.2 GHz,二级缓存从256KB翻一番,达到512KB。 Netburst的功耗和散热依然存在。然而,Northwood却表现较好,对AMD的竞争非常激烈。


在高端机型上,英特尔还推出了超线程技术,以提高强调多任务的环境中的资源利用率。 超线程在 Northwood 上并不像现在的 Core i7 处理器那样有利,但是它的性能提高了几个百分点。

Willamette Northwood 也在 Celeron Xeon 品牌的 CPU 中发布。 与上一代基于 Celeron Xeon 的产品一样,英特尔提升或降低了二级缓存大小,以区分其性能。

P6 :奔腾 M


由于Netburst被设计为一个功能强大的高性能架构,并没有将其转化为移动系统。相反,在2003年,英特尔创建了专门为笔记本电脑设计的第一个架构。 Pentium-M基于P6架构,但具有更长的12-14级流水线。这也是英特尔的第一个可变长度管道,这意味着如果指令所需的信息已经加载到缓存中,则可以在仅仅12个阶段之后执行指令。如果没有,它必须经过两个额外的阶段来加载数据。


这些处理器中的第一个采用130nm晶体管制程,并包含1MB二级缓存。它设法达到1.8 GHz,而功耗仅为24.5W。被称为“Dothan”的后续版本于2004年发布,转换为90nm制程。这使得英特尔将L2缓存增加到2MB,并结合许多核心增强功能,提供了体面的IPC吞吐量改进。 CPU也扩大到2.27 GHz,功率略微增加到27W。

Pentium-M架构最终在Stealey A100移动CPU内部使用,之后被Intel的Atom处理器所取代。

Netburst: Prescott


Northwood 2002 年至 2004 年将 Netburst 架构运行,之后英特尔推出了 Prescott ,并进行了大量改进。 它采用了 90nm 的制造工艺,使 Intel 能够将 L2 缓存增加到 1MB 英特尔还推出了新的 LGA 775 接口,其特点是支持 DDR2 内存和比第一个基于 Northwood CPU 更快的四泵浦 FSB 这些变化导致 Prescott 的带宽明显高于 Northwood ,这对于提高净爆弹的表现至关重要。 Prescott 还是英特尔第一款 64 x86 处理器,允许它一次访问更多的 RAM 并运行 64 位。


普雷斯科特应该是英特尔基于Netburst处理器系列的失败案例。英特尔再次延长其执行流程,此次达到31个阶段。该公司希望提高时钟速率足以抵消更长的管道,但只能达到3.8 GHz。普雷斯科特太热了,功耗高。英特尔预计采用90nm制程以缓解这个问题,但晶体管密度的增加使得制冷更加困难。由于无法达到更高的频率,普雷斯科特的进化变化会损害整体性能。

即使有了所有的增强功能和额外的缓存,Prescott在任何给定的时钟速率下,都与Northwood一样。大约在同一时间,AMD的K8处理器也正在向更小的晶体管制程转移,从而使其处于更高的频率。在这个短暂的时间内,AMD主宰了桌面CPU市场。

Netburst :奔腾 D


2005年,这场比赛是为了生产第一个面向消费者的双核处理器。 AMD已经宣布了其双核Athlon 64,英特尔通过使用包含两个Prescott芯片的多核模块(MCM)击败AMD。该公司称其双核处理器为奔腾D,而第一款型号为“史密斯菲尔德”。







请到「今天看啥」查看全文