英特尔已称霸半导体业多年,
CPU
无疑是其安身立命之本。
眼下在非移动处理器市场风光无限的英特尔,其实也有着发展路上苦涩的经历,各种成功、失败、喜悦、沮丧,汇集在一起,才使得这位行业大佬发展到今天这样的位置。
下面,小编就带你梳理一下该公司历史上的
35
款经典芯片,看英特尔
CPU
的发展都经历了哪些鲜为人知的故事,也看看它走麦城时候的样子。
始于
4004
1971
年,英特尔第一款微处理器——四位的
4004
面世,它与其他三个芯片配合工作,分别是
4001
的
ROM
,
4002
的
RAM
,以及移位寄存器
4003
。而
4004
负责进行计算。当时,
4004
在计算器和类似的设备中大量采用,但还未能应用于计算机中,它的最大时钟速度为
740 kHz
。
4004
之后,一款类似的处理器出现了,称为
4040
,它基本上是一款扩展的指令集和更高性能的改进版本的
4004
。
8008
和
8080
4004
打响了英特尔微处理器业务的第一枪,随后,英特尔推出了全新的八位处理器,
1972
年,
8008
诞生,紧随其后的是
1974
年的
8080
和
1975
年的
8085
。
8008
是由英特尔生产的第一款八位处理器,值得一提的是,
8080
的速度比
4004
快,这得益于其八位处理数据的能力,但它的时钟频率偏保守,在
200kHz~800kHz
之间,
8008
的性能没有能够吸引多少系统开发商。
8008
使用
10
微米晶体管制程技术。
8080
则较为成功。它在
8008
基础上加入了新的指令,并过渡到了
6
微米的晶体管制程。这使其时钟速率提升了一倍以上,
1974
年,最高性能的
8080
芯片运行在
2 MHz
。
8080
被应用到了很多设备当中,这导致一些软件开发商,如那段时间刚成立的微软,开始关注适用于英特尔处理器的软件开发。
当
8086
发布时,它是基于
8080
,并保持软件的向后兼容性。
8080
和关键硬件因素已出现在所有基于
x86
处理器的生产当中,
8080
的软件可以运行在任何
x86
处理器上。
8085
是一个不太昂贵,且时钟频率更高的变种
8080
。
8086
:
x86
的开始
英特尔首款
16
位处理器是
8086
,相比以前的设计,提高了性能。它不仅是主频高于
8088
,还采用
16
位外部数据总线和一个
6
字节的预取队列。它也能够运行
16
位的任务(尽管大多数软件是专为八位处理器设计的)。地址总线扩展到
20
位,使
8086
可以访问
1MB
内存,性能明显提高。
8086
成为了第一个
x86
处理器,它使用了
x86ISA
的第一次修订,后来,几乎所有由英特尔和
AMD
开发的处理器都是建立在
8086
基础之上的。
英特尔在同一时间还推出了
8088
。该处理器是基于
8086
的,但是有很多数据线和四字节的指令预取队列都减半,这导致失去平衡,为窄总线切取指令率,迫使其执行单元空闲的时间不多。它具有
1MB
的
RAM
,比以前的处理器更高的频率,但它比
8086
慢一点。
80186
和
80188
英特尔跟进
8086
与其他几个处理器,所有这些都使用了类似的
16
位架构。第一次是在
80186
上,针对嵌入式应用。为推动这项工作,英特尔将主板上的一些硬件进了
CPU
,包括时钟发生器、中断控制器、定时器。对某些指令,即使在相同的时钟频率,
80186
比
8086
跑得快得多。当然,英特尔自然会提升
CPU
的频率,以进一步提高性能。
80188
同样把一些硬件功能块集成了进去。但同
8088
一样,其数据总线减少了一半。
80286
:更多的内存,更高的性能
80286
与
80186
在同一年发布,性能几乎相同,但它的扩展地址总线为
24
位,使处理器能够访问到
16MB
内存。
iAPX 432
iAPX 432
是英特尔早期尝试从
x86
投资组合中脱颖而出的一种完全不同的设计。
英特尔预计
iAPX 432
比其他产品快几倍。然而,该款处理器最终失败了,原因在于一些设计缺陷。虽然
x86
处理器相对复杂,但
iAPx 432
将
CISC
带到了一个全新的复杂程度。硬件设计相当大胆,迫使英特尔将其从两个独立的
die
中进行制作。该处理器如果没有极高的带宽,则表现不佳。
iAPX 432
的性能超过了
8080
和
8086
,但是它很快就被较新的
x86
产品超过了,因此,最终被放弃了。
i960
:英特尔的第一个
RISC
处理器
英特尔在
1984
年推出了其第一个
RISC
处理器。它不是
x86
处理器的直接竞争对手,因为它是作为一个安全的嵌入式解决方案。它使用伯克利
RISC
设计概念的
32
位超标量架构。第一款
i960
处理器的时钟频率相对较低,其中最慢的模式运行在
10 MHz
,但多年来,它被改进,并转变为使用更高的制程,使其达到
100 MHz
。它还支持
4GB
的受保护的内存。
i960
被广泛应用在军事和商业系统。
80386
:
32
位
x86
处理器
英特尔的第一个
32
位
x86
处理器是
80386
,发布于
1985
年。该处理器有一个关键的优势是它的
32
位地址总线,可以支持高达
4GB
的系统内存。虽然这远远超过所有人的使用需求,内存限制往往伤害现有
x86
的性能和竞争处理器。与现代
CPU
不同的是,在
80386
发布的时候,更多的
RAM
几乎总是转化为性能提升。
英特尔还实施了几个架构增强功能,可以将性能提升到
80286
以上,即使两个系统都使用相同的
RAM
数量。它还支持虚拟模式处理,从而增加了多任务支持。
为了更经济的分割其产品阵容,英特尔还推出了
80386SX
。
这个处理器与
80386
几乎相同,它仍然采用
32
位架构,但其数据总线的一半被削减到
16
位,以节省成本。
i860
1989
年,英特尔又试图摆脱其
x86
处理器,它推出了一个称为
i860
的新
RISC CPU
。
与早期的
i960
不同,该
CPU
被设计为在桌面市场上竞争的高性能模型,但设计证明是有问题的。
其最重要的缺陷是处理器的性能完全依赖于编译器,按照在软件首次创建时需要执行的顺序放置指令,
这有助于英特尔保持芯片尺寸和
i860
的整体复杂性,但是在编译程序时,几乎无法正确列出从开始到结束的所有指令,这导致
CPU
在尝试解决问题时不断停止工作。
80486
:集成
FPU
英特尔的
80486
在性能方面又是一个重大的进步。
其成功的关键是将组件更紧密地集成到
CPU
中。
80486
是第一个包含
L1
缓存的
x86 CPU
。
早期的
80486
型号带有
8KB
的裸片,并在
1000nm
工艺上刻蚀。
但随着设计转变为
600nm
,
L1
缓存大小翻了一番,达到了
16KB
。
英特尔还将
FPU
整合到
CPU
中,到目前为止,这是一个单独的功能处理单元。
通过将这些硬件移动到主机处理器中,它们之间的延迟急剧下降。
80486
还使用更快的
FSB
接口来增加带宽,并且核心有各种其他调整推动
IPC
。
这些变化显着提高了
80486
的性能,高端机型比旧式
80386
快了多倍。
第一个
80486
处理器达到
50 MHz
,后来使用改进的
600nm
工艺的型号高达
100 MHz
。
为了针对经济型用户,英特尔还发布了一款名为
80486SX
的
80486
版本,其中
FPU
已被禁用。
P5
:第一个奔腾处理器
Pentium
于
1993
年出现,是第一款不遵循
80x86
号码系统的
Intelx86
处理器。
在内部,
Pentium
使用了
P5
架构,这是英特尔首款
x86
超标量设计。
虽然奔腾的速度一般比
80486
快,但其最突出的特点就是
FPU
大大提高。
原始奔腾的
FPU
比
80486
的老化单位快十倍以上。
这在英特尔发布奔腾
MMX
的后期几年中变得更加显着。
这款处理器在架构上与原始
Pentium
相同,但支持英特尔新的
MMXSIMD
指令集,可大幅提升性能。
英特尔还相对于
80486
增加了奔腾处理器的
L1
缓存。初始
Pentium
包含
16KB
,而
Pentium MMX
则上升到
32KB
。
当然,这些处理器也以较高的时钟速率运行。
第一台
Pentium
处理器使用
800nm
晶体管制程,可能只能达到
60 MHz
,但随后转变为英特尔
250nm
工艺,并将频率推高至
300MHz
。
P6
:
Pentium Pro
英特尔计划以
Pentium Pro
为基础的
P6
架构快速跟随奔腾,但遇到了技术难题。
由于其无序(
OoO
)设计,
Pentium Pro
在
32
位操作中比
Pentium
快得多。
它具有重新设计的内部架构,将指令解码为微操作,然后在通用执行单元上执行。
由于附加的解码硬件,它还使用了显着扩展的
14
级流水线。
由于第一款
Pentium Pro
处理器面向服务器市场,英特尔将地址总线再次扩展到
36
位,并增加了
PAE
技术,使其能够支持高达
64GB
的
RAM
。
这远远超过一般用户的需求,但是能够支持更大量的
RAM
是英特尔服务器的关键。
处理器的缓存系统也被重做。 L1缓存限于两个分段的8KB缓存,一个用于指令,一个用于数据。为了弥补与Pentium MMX相比的16KB的缺陷,英特尔在附加到CPU包的单独芯片上放置了256KB和1MB的L2缓存。它使用背面总线(BSB)连接到CPU。
英特尔最初计划将Pentium Pro推向消费者,但最终将其限制为服务器产品。 Pentium Pro具有几项革命性的功能,但在性能方面却与Pentium和Pentium MMX相悖。在16位操作中,较早的Pentium部件都显着增加,16位软件在当时仍然被大量使用。处理器也不支持MMX指令集,这导致奔腾MMX在MMX优化软件中表现优于Pentium Pro。
Pentium Pro可能在消费市场上有机会,但由于包含L2缓存的独立芯片,生产成本也相当高昂。 最快的PentiumPro处理器的运行频率为200 MHz,采用500到350nm之间的晶体管制程。
P6
:奔腾
II
英特尔并没有放弃P6架构,而是等到1997年发布了Pentium II。奔腾II设法克服了Pentium Pro几乎所有的负面因素。其基础架构与Pentium Pro类似,并且继续使用一个14阶段的管道,对内核进行了几项改进,以改进IPC。 L1增长到16KB数据+ 16KB指令高速缓存。
英特尔也转移到更加经济实惠的高速缓存芯片,连接到更大的硅封装以降低生产成本。这是使Pentium II成本更低的有效方法,但这些内存模块无法以CPU的速度运行。相反,L2缓存以半频率运行,而这些早期的处理器足以提高性能。
英特尔还增加了对MMX指令集的支持。 Pentium II内部使用的代码为“Klamath”和“Deschutes”的CPU内核也被销售为服务器的至强和奔腾II Overdrive产品。最高性能型号包含512KB的L2缓存,运行频率为450 MHz。
P6
:
1 GHz
的奔腾
III
英特尔计划使用基于其Netburst架构的处理器来跟踪奔腾II,但尚未准备好。相反,英特尔将P6架构再次推出为Pentium III。
这些处理器中的第一个代号为“Katmai”,与Pentium II非常相似,因为它使用了一个含有低质量二级缓存的插槽式墨盒,占据CPU速度的一半。底层架构纳入其他重大变化,因为14级管道的几个部分融合在一起,将其缩短到10个等级。由于更新的管道和时钟速度的提高,奔腾III处理器中的第一个处理器通常以小幅度优于其Pentium II对手。
Katmai使用250nm晶体管制程。 然而,随着迈向180nm制造工艺,英特尔能够显着提升Pentium III的性能。这个更新的实现,代号为“Coppermine”,将L2缓存移动到CPU中,并将其容量减少一半(低至256KB)。但是由于能够以处理器的频率运行,性能仍然高涨。
Coppermine是英特尔与AMD Athlon的竞争产品,在竞争中打破了1GHz。 英特尔试图生产1.13GHz的型号,但是汤姆硬件公司的Tom Pabst博士调查发现,这是不稳定的情况后,最终才被召回。这使得1 GHz型号成为最快的Coppermine Pentium III。
Pentium III内核的最后一个命名为“Tualatin”。 它采用130nm工艺,时钟频率高达1.4GHz。 它还将L2缓存增加到512KB,这有助于提高性能。
P5
和
P6
:赛扬和至强
在奔腾II发布之前,英特尔还推出了其Celeron和Xeon产品系列。这些产品使用与Pentium II或Pentium III相同的内核,但具有不同数量的缓存。基于Pentium II的第一款Celeron品牌处理器根本没有二级缓存,导致了可怕的性能。与Pentium III相比,之前基于Pentium III的型号的二级缓存的一半禁用。这导致Celeron处理器使用的Coppermine内核只包含128KB的L2缓存; 基于Tualatin的后期模型将其增加到256KB。
这些半高速缓存衍生产品被称为Coppermine-128和Tualatin-256。英特尔以与Pentium III相当的时钟速度出货,这使得他们表现良好,使其对AMD的Duron处理器具有很强的竞争力。微软使用了以733 MHz为单位的Coppermine-128 Celeron处理器,作为Xbox游戏机的CPU。
第一个Xeon处理器类似,但它们包含更多的L2缓存。基于Pentium II的至强处理器至少包含512KB,与Pentium II CPU相同,而高端机型则可能高达2MB。
Netburst
在讨论英特尔Netburst架构和奔腾4之前,重要的是要检查其深层流程背后的想法,该思路描述了指令通过核心的过程。线程通常执行多个任务,但有时它们专门用于单个功能。通过添加新硬件或将一个线程分为多个线程,可以扩展执行通道。处理器流水线也可以通过删除硬件或将多个组件下载到单个线程来缩小。
管道的长度或深度对延迟,IPC,时钟速度和架构的吞吐量有直接影响。较长的管道通常需要大量的带宽,但是如果流水线保持适当的数据馈送,那么管道中的每个阶段都保持忙碌状态。具有更长管道的处理器通常能够以更高的时钟速率运行。
在处理器内部的权衡是更高的延迟,因为流经它的数据必须在每个阶段停止一定数量的时钟周期。使用长管道的处理器也倾向于具有较低的IPC,这就是为什么它们依靠更高的频率来提高性能。多年来,执行这两种理念的处理器已经证明是成功的。
Netburst
:奔腾
4Willamette
和
Northwood
在2000年,英特尔的Netburst架构终于准备好了,并被推出了奔腾4。这个组合将在未来六年内领衔英特尔的高端CPU。第一个被命名为“Willamette”,它在其生命的头两年承载了Netburst和Pentium 4。然而,这对英特尔来说是一个困扰的时期,芯片的竞争力超过奔腾III。 Netburst能够显着提高频率,Willamette设法达到2 GHz,但在某些任务中,1.4 GHz的Pentium III仍然更快。AMD的Athlon处理器在此期间表现良好。
Willamette的问题是,英特尔将管道延伸到20个线程,并计划获得超过2GHz的时钟频率,但由于功耗和散热问题,它无法实现这些目标。英特尔的130nm设计被称为“Northwood”,情况有所改善,扩大到3.2 GHz,二级缓存从256KB翻一番,达到512KB。 Netburst的功耗和散热依然存在。然而,Northwood却表现较好,对AMD的竞争非常激烈。
在高端机型上,英特尔还推出了超线程技术,以提高强调多任务的环境中的资源利用率。
超线程在
Northwood
上并不像现在的
Core i7
处理器那样有利,但是它的性能提高了几个百分点。
Willamette
和
Northwood
也在
Celeron
和
Xeon
品牌的
CPU
中发布。
与上一代基于
Celeron
和
Xeon
的产品一样,英特尔提升或降低了二级缓存大小,以区分其性能。
P6
:奔腾
M
由于Netburst被设计为一个功能强大的高性能架构,并没有将其转化为移动系统。相反,在2003年,英特尔创建了专门为笔记本电脑设计的第一个架构。 Pentium-M基于P6架构,但具有更长的12-14级流水线。这也是英特尔的第一个可变长度管道,这意味着如果指令所需的信息已经加载到缓存中,则可以在仅仅12个阶段之后执行指令。如果没有,它必须经过两个额外的阶段来加载数据。
这些处理器中的第一个采用130nm晶体管制程,并包含1MB二级缓存。它设法达到1.8 GHz,而功耗仅为24.5W。被称为“Dothan”的后续版本于2004年发布,转换为90nm制程。这使得英特尔将L2缓存增加到2MB,并结合许多核心增强功能,提供了体面的IPC吞吐量改进。 CPU也扩大到2.27 GHz,功率略微增加到27W。
Pentium-M架构最终在Stealey A100移动CPU内部使用,之后被Intel的Atom处理器所取代。
Netburst: Prescott
Northwood
从
2002
年至
2004
年将
Netburst
架构运行,之后英特尔推出了
Prescott
,并进行了大量改进。
它采用了
90nm
的制造工艺,使
Intel
能够将
L2
缓存增加到
1MB
。
英特尔还推出了新的
LGA 775
接口,其特点是支持
DDR2
内存和比第一个基于
Northwood
的
CPU
更快的四泵浦
FSB
。
这些变化导致
Prescott
的带宽明显高于
Northwood
,这对于提高净爆弹的表现至关重要。
Prescott
还是英特尔第一款
64
位
x86
处理器,允许它一次访问更多的
RAM
并运行
64
位。
普雷斯科特应该是英特尔基于Netburst处理器系列的失败案例。英特尔再次延长其执行流程,此次达到31个阶段。该公司希望提高时钟速率足以抵消更长的管道,但只能达到3.8 GHz。普雷斯科特太热了,功耗高。英特尔预计采用90nm制程以缓解这个问题,但晶体管密度的增加使得制冷更加困难。由于无法达到更高的频率,普雷斯科特的进化变化会损害整体性能。
即使有了所有的增强功能和额外的缓存,Prescott在任何给定的时钟速率下,都与Northwood一样。大约在同一时间,AMD的K8处理器也正在向更小的晶体管制程转移,从而使其处于更高的频率。在这个短暂的时间内,AMD主宰了桌面CPU市场。
Netburst
:奔腾
D
2005年,这场比赛是为了生产第一个面向消费者的双核处理器。 AMD已经宣布了其双核Athlon 64,英特尔通过使用包含两个Prescott芯片的多核模块(MCM)击败AMD。该公司称其双核处理器为奔腾D,而第一款型号为“史密斯菲尔德”。