Intel CPU 发展简史

处理器发展史.png

1971年11月15日:4004

1971年11月15日,Intel公司的工程师霍夫发明了世界上第一个商用微处理器—4004。这款4位微处理器集成了2250个晶体管,晶体管之间的距离是10微米,能够处理4bit的数据,每秒运算6万次,频率为108KHz,前端总线为0.74MHz (4bit)。原为日本Busicom公司的计数器开发。

编号为4004,第一个“4”代表此芯片是客户订购的产品编号,后一个“4”代表此芯片是英特尔公司制作的第四个订制芯片,之前还有4001(动态内存DRAM)、4002(只读存储器ROM)、4003(Register),这种数字代号却延用至今。采用4004芯片后,再配用一块程序存储器,数据存储器,移位寄存器,再加上键盘和数码管,就构成了一台完整的微型计算机。

4004的最高频率有740kHz,能执行4位运算,支持8位指令集及12位地址集。

4004只能称为世界上第一款商用处理器,而不是世界上第一款微处理器。第一款微处理器应该是美国军方研制,用于F-14雄猫战机中由6颗晶片组成的中央空气数据计算机:CADC(CenterAir Data Computer),虽然它的构造比4004还要简单,速度只有9.15KHz。

1972年:8008

8008频率为200KHz,晶体管的总数已经达到了3500个,能处理8比特的数据,性能是4004的两倍,速度为200KHz。更为重要的是,英特尔还首次获得了处理器的指令技术。

8008芯片原本是为德克萨斯州的Datapoint公司设计的,但是这家公司最终却没有足够的财力支付这笔费用。于是双方达成协议,英特尔拥有这款芯片所有的知识产权,而且还获得了由Datapoint公司开发的指令集。这套指令集奠定了今天英特尔公司X86系列微处理器指令集的基础。

执行8位运算,支持16位地址总线和16位数据总线。

1974年:8080

在微处理器发展初期,具有革新意义的芯片非Intel8080莫属了。由于采用了复杂的指令集以及40管脚封装,8080的处理能力大为提高,其功能是8008的10倍,每秒能执行29万条指令,集成晶体管数目6000,运行速度2MHz。

与此同时,微处理器的优势已经被业内人士所认同,于是更多的公司开始接入这一领域,竞争开始变得日益激烈。当时与英特尔同台竞技的有RCA(美国无线电公司)、Honeywell、Fairchild、美国国家半导体公司、AMD、摩托罗拉以及Zilog公司。值得一提的是Zilog,世界上第一块4004芯片的设计者Faggin就加盟了该公司。由该公司推出的Z80微处理器比Intel8080功能更为强大,而且直到今天这款处理器仍然被尊为经典。

8080有幸成为了第一款个人计算机Altair的大脑。

8位元处理器,拥有16位地址总线和8位数据总线,包含7个八位寄存器,支持16位寻址,同时也包含一些输入输出端口,有效解决了外部设备在内存寻址能力不足的问题。

1978年:8086-8088

1978年,英特尔推出了首枚16位微处理器8086,同时生产出与之配合的数学协处理器8087,这两种芯片使用相同的指令集,以后英特尔生产的处理器,均对其兼容。趁着市场销售正好的时机,以及市场需求的提升,Intel在同一年推出了性能更出色的8088处理器。三款处理器都拥有29000只晶体管,速度可分为5MHz、8MHz、10MHz,内部数据总线(处理器内部传输数据的总线)、外部数据总线(处理器外部传输数据的总线)均为16位,地址总线为20位,可寻址1MB内存。首次在商业市场给消费者提供了更自由选择。

1982年:80286

80286(也称286)是处理器进入全新技术的标准产品,具备16位字长,集成了14.3万只晶体管,具有6MHz、8MHz、10MHz、12.5MHz四个主频的产品。286是Intel第一款具有完全兼容性的处理器,即可以运行所有针对其前代处理器编写的软件,这一软件兼容性也成为了Intel处理器家族一个恒久不变的特点。286是英特尔的最后一块16位处理器

最大主频为20MHz,采用16位数据总线和24位地址总线。

80286有两种工作模式:实模式和保护模式。在实模式下,80286直接访问内存的空间被限制在1M字节,更多内存需要通过EMS或XMS内存机制进行映射。而在保护模式下,80286可以直接访问16M字节的内存,并具有异常处理机制。

1985年:80386

英特尔第一款32位处理器,集成了27万5千只晶体管,超过了4004芯片的一百倍,每秒可以处理500万条指令。同时也是第一款具有“多任务”功能的处理器,所谓“多任务”就是说它可以同时处理多个程序程序的指令,这对微软的操作系统发展有着重要的影响。

重要特点:

  1. 首次在x86处理器中实现了32位系统,
  2. 可配合使用80387数字辅助处理器增强浮点运算能力
  3. 首次采用高速缓存(外置)解决内存速度瓶颈问题。

由于这些设计,80386的运算速度达到了前代产品80286的数倍。80386DX的内部和外部数据总线(或资料汇流排)是32位,地址总线(或位址汇流排)也是32位,可以定址到4GB内存,并可以管理64TB的虚拟存储空间(虚拟存储空间:通过硬件和软件的综合来扩大用户可存储空间,它在内存储器和外存储器(磁盘、光盘)之间增加一定的硬件和软件支持,使两者形成一个有机整体,支持运行比实际配置的内存容量大的多的大任务程序)。

80386有三种工作模式:实模式、保护模式、虚拟86模式。真实模式为DOS系统的常用模式,直接内存访问空间被限制在1M字节(也叫做位元组);保护模式下80386-DX可以直接访问4G位元组的内存,并具有异常处理机制;虚拟86模式可以同时模拟多个8086处理器来加强多工处理能力。

Intel RapidCAD 被遗忘的微处理器

RapidCAD是英特尔有史以来第一款为旧款个人计算机所提供的升级套件(也就是OverDrive的始祖)。原386的使用者不需要更换主机板,只要把RapidCAD买回来将主机板上旧有的中央处理器芯片(CPU)替换掉,就可以享受接近486的运算能力。RapidCAD其实就是把486 DX芯片去掉内部高速缓存然后装入386的封装里面,RapidCAD也不支持486增加的新指令。不过由于386封装的频宽限制,RapidCAD对整体的效能提升比不上直接升级到486 DX。相同频率下,486 DX可以有比386/387快上两倍的速度,而RapidCAD在整数运算方面最多只能提升35%,在浮点运算方面,则可以提升将近70%。

Intel RapidCAD特殊的地方在于,它是由两颗芯片组成,缺一不可。这归咎于486 DX内建浮点运算器(FPU),而386则是将浮点运算器分开(就是387)。由于RapidCAD-1本身就含有浮点运算器(因为它就是486 DX阉割版),根本不需要387,所以RapidCAD-2就是用来替代原来主机板上的387芯片。RapidCAD-1负责所有的运算,而RapidCAD-2则是负责模拟浮点运算器,以防止旧有主机板以为没有安装浮点运算功能(尤其在执行286/287的程序时)。市面上有时候把RapidCAD-1与RapidCAD-2分开卖,这就是不了解RapidCAD运作方式的结果。

1989年:80486

80486处理器集成了125万个晶体管,时钟频率由25MHz逐步提升到33MHz、40MHz、50MHz及后来的100MHz。486家族的指令集与386非常相似,只有增加少量的指令。

486处理器的应用意味着用户从此摆脱了命令形式的计算机,进入“选中并点击(point-and-click)”的计算时代。英特尔486处理器首次采用内建的数学协处理器,将负载的数学运算功能从中央处理器中分离出来,从而显著加快了计算速度。

386和486推向市场后,均大获成功,英特尔在芯片领域的霸主地位日益凸现。此后,英特尔开始告别微处理器数字编号时代,进入到了Pentium时代。

1994年3月10日:Intel Pentium中央处理器芯片

1993年,英特尔发布了Pentium(俗称586)中央处理器芯片(CPU)。本来按照惯常的命名规律是80586,但是在486发展末期,就已经有公司将486等级的产品标识成586来销售了。因此英特尔决定使用自创的品牌来作为新产品的商标—Pentium。

英特尔奔腾处理器采用了0.60微米工艺技术制造,核心由320万个晶体管组成。支持计算机更轻松的集成“现实世界”数据,如语音、声音、手写体和图片等。

Pentium是x86系列一大革新。其中晶体管数大幅提高、增强了浮点运算功能、并把十年未变的工作电压降至3.3V。Pentium刚推出的时候拥有浮点数除法不正确的错误(FDIV Bug),导致英特尔大量回收第一代产品(1994年12月之前的产品),所以有FDIV Bug的微处理器所剩不多。Pentium 50MHz也有这个FDIV错误,不过A80501-50只是业界样本,从来没有在市场上出现过。

1995年3月27日,英特尔发布Pentium 120MHz处理器,采用了0.60微米/0.35两种工艺技术,不过核心依旧由320万个晶体管组成。

1995年6月,英特尔发布Pentium 133MHz处理器,采用0.35工艺技术制造,核心提升到由330万个晶体管组成。

1995年11月1日,英特尔发布Pentium 150MHz、Pentium 166MHz、Pentium 180MHz、Pentium 200MHz四款处理器,并且采用了0.60微米/0.35两种工艺技术,核心提升到由550万个晶体管组成。此时INTEL在以前设计基础上增加了L2 cache为256K和512K两种版本。

1996年1月4日,英特尔又发布Pentium 150MHz、Pentium 166MHz两款处理器,采用了0.35微米工艺技术,不过核心由330万个晶体管组成。

1996年6月10日,英特尔发布Pentium 200MHz处理器,采用了0.35微米工艺技术,不过核心还是由330万个晶体管组成。

1996年:Intel Pentium Pro

PentimuPro的内部含有高达550万个的晶体管,内部时钟频率为133MHz,处理速度几乎是100MHz的Pentium的2倍。PentimuPro的一级(片内)缓存为8KB指令和8KB数据。值得注意的是在PentimuPro的一个封装中除PentimuPro芯片外还包括有一个256KB的二级缓存芯片,两个芯片之间用高频宽的内部通讯总线互连,处理器与高速缓存的连接线路也被安置在该封装中,这样就使高速缓存能更容易地运行在更高的频率上。PentiumPro 200MHz CPU的L2 Cache就是运行在200MHz,也就是工作在与处理器相同的频率上。这样的设计领PentiumPro达到了最高的性能。而PentimuPro最引人注目的地方是它具有一项称为“动态执行”的创新技术,这是继Pentium在超标量体系结构上实现实破之后的又一次飞跃。PentimuPro系列的工作频率是150/166/180/200,一级缓存都是16KB,而前三者都有256KB的二级缓存,至于频率为200的CPU还分为三种版本,不同就在于他们的内置的缓存分别是256KB,512KB,1MB。

1997年1月:Intel Pentium MMX

Pentium MMX芯片在X86指令集的基础上加入了57条多媒体指令。这些指令专门用来处理视频、音频和图象数据,使CPU在多媒体操作上具有更强大的处理能力,Pentium MMX还使用了许多新技术。单指令多数据流SIMD技术能够用一个指令并行处理多个数据,缩短了CPU在处理视频、音频、图形和动画时用于运算的时间;流水线从5级增加到6级,一级高速缓存扩充为16K,一个用于数据高速缓存,另一个用于指令高速缓存,因而速度大大加快;Pentium MMX还吸收了其他CPU的优秀处理技术,如分支预测技术和返回堆栈技术。

Pentium MMX等于是Pentium的加强版中央处理器芯片(CPU),除了增加67个MMX(Multi-Media eXtension)指令以及64位数据型态之外之外,也将内建指令及数据暂存(Cache)从之前的8KB增加到16KB,内部工作电压降到2.8V。而英特尔之后的桌上型中央处理器皆包含了MMX指令。

1997年:Intel Pentium Overdrive

Intel Pentium OverDrive中央处理器芯片(CPU),又是一项英特尔造福旧计算机使用者的升级选择。Pentium OverDrive有两种,一种(不含MMX,5V)是给80486升级用的,另一种(含MMX,3.3V)是给Pentium早期产品(Socket6, 50-66MHz)升级的。他们都有含散热器及风扇。

1997-1998年:Pentium II

1997年5月7日,英特尔发布Pentium II 233MHz、Pentium II 266MHz、Pentium II 300MHz三款PII处理器,采用了0.35微米工艺技术,核心提升到750万个晶体管组成。采用SLOT1架构,通过单边插接卡(SEC)与主板相连,SEC卡盒将CPU内核和二级高速缓存封装在一起,二级高速缓存的工作速度是处理器内核工作速度的一半;处理器采用了与Pentium PRO相同的动态执行技术,可以加速软件的执行;通过双重独立总线与系统总线相连,可进行多重数据交换,提高系统性能;PentiumII也包含MMX指令集。Intel此举希望用SLOT1构架的专利将AMD等一棍打死,可没想到Socket 7平台在以AMD的K6-2为首的处理器的支持下,走入了另一个春天。而从此开始,Intel也开始走上了一条前途不明的道路,开始频繁的强行制定自己的标准,企图借此达到迅速挤垮竞争对手的目的,但市场与用户的需要使得Intel开始不断的陷入被动和不利的局面。

在这个时期100MHz频率的SDR内存已经出现在市场上,但是Intel却惊人地宣布他们将放弃并行内存而主推一种名为Rambus的内存,而一时间众多大公司如西门子、HP和DELL等都投入了Rambus的门下,不过后来DDR内存的流行也证明了Intel的失败。

1997年6月2日,英特尔发布MMX指令技术的Pentium II 233MHz处理器,采用了0.35微米工艺技术,核心由450万个晶体管组成。

1997年8月18日,英特尔发布L2 cache为1M的Pentium II 200MHz处理器,采用了0.35微米工艺技术,核心由550万个晶体管组成。

1998年1月26日,英特尔发布Pentium II 333MHz处理器,采用了0.35微米工艺技术,核心由750万个晶体管组成。

1998年4月15日,英特尔发布Pentium II 350MHz、Pentium II 400MHz和第一款Celeron 266MHz处理器,此三款CPU都采用了最新0.25微米工艺技术,核心由750万个晶体管组成。

1998年8月24日,英特尔发布Pentium II 450MHz处理器,采用了0.25微米工艺技术,核心由750万个晶体管组成。

CPU发展到这个时期,就不能不说说Intel Pentium II Cerelon处理器。英特尔将Celeron处理器的L2 Cache设定为只有Pentium II的一半(也就是128KB),这样既有合理的效能,又有相对低廉的售价(有A字尾的);这样的策略一直延续到今天。不过很快有人发现,使用双Celeron的系统与双Pentium II的系统差距不大,而价格却便宜很多,结果造成了Celeron冲击高阶市场的局面。后来英特尔决定取消Celeron处理器的SMP功能,才解决了这个问题。

Pentium II Celeron处理器

Celeron(赛扬)300A,是一个让多少人闻之动容的产品,又陪伴了多少曾经年少的读者度过悠长的学生时代。赛扬300A,从某种意义上已经是Intel的第二代赛扬处理器。第一代的赛扬处理器仅仅拥有266MHz、300MHz两种版本,第一代的Celeron处理器由于不拥有任何的二级缓存,虽然有效的降低了成本,但是性能也无法让人满意。为了弥补性能上的不足,Intel终于首次推出带有二级缓存的赛扬处理器——采用Mendocino核心的Celeron300A、333、366。经典,从此诞生。

1999年:Intel Pentium III

1999年2月26日,英特尔发布Pentium III 450MHz、Pentium III 500MHz处理器,同时采用了0.25微米工艺技术,核心由950万个晶体管组成,从此Intel开始踏上了PIII旅程。

Pentium III是给桌上型计算机的中央处理器芯片(CPU),等于是Pentium II的加强版,新增七十条新指令(SIMD,SSE)。Pentium III与Pentium II一样有Mobile、Xeon以及Cerelon等不同的版本。Celeron系列与Pentium III最大的差距在于二级缓存,100MHz外频的Tualatin Celeron 1GHz可以轻松地跃上133MHz外频。更为重要的是,Tualatin Celeron还有很好的向下兼容性,甚至440BX主板在使用转接卡之后也有望采用该CPU,因此也成为很多升级用户的首选。

特别指出的是,Pentium III光是桌上型就拥有Katmai Slot 1 、Coppermine Slot 1以及Coppermine Socket 370等三种不同的系列。到后期,英特尔放弃插卡式界面而又回归到插槽界面(Socket 370)。socket370封装开始推出的时候,有一部分消费者舍弃了slot1平台而选择了新的处理器。新的PGA封装分为PPGA和FC-PGA两种,前者较为廉价,因而被赛扬处理器所采用,而更为昂贵的后者则被奔腾III处理器所采用。例外的是:采用Mendocino核心的赛扬处理器同时有这两种不同封装的版本。采用PPGA封装的赛扬处理器可以通过转接卡在slot1主板上使用,而采用FC-PGA封装的奔三处理器则无能为力了。

2000年:Intel Pentium IV

Pentium 4处理器集成了4200万个晶体管,到了改进版的Pentium 4(Northwood)更是集成了5千5百万个晶体管;并且开始采用0.18微米进行制造,初始速度就达到了1.5GHz。

Pentium 4还提供的SSE2指令集,这套指令集增加144个全新的指令,在128bit压缩的数据,在SSE时,仅能以4个单精度浮点值的形式来处理,而在SSE2指令集,该资料能采用多种数据结构来处理:

4个单精度浮点数(SSE)对应2个双精度浮点数(SSE2),对应16字节数(SSE2),对应8个字数(word),对应4个双字数(SSE2),对应2个四字数(SSE2),对应1个128位长的整数(SSE2) 。

2002-2004年:超线程P4处理器

2002年11月14日,英特尔在全新英特尔奔腾4处理器3.06GHz上推出其创新超线程(Hyper-Threading,HT)技术。超线程(HT)技术支持全新级别的高性能台式机,同时快速运行多个计算应用,或为采用多线程的单独软件程序提供更多性能。超线程(HT)技术可将电脑性能提升达25%。除了为台式机用户引入超线程(HT)技术外,英特尔在推出英特尔奔腾4处理器3.06GHZ时达到了一个电脑里程碑。这是第一款商用微处理器,运行速率为每秒30亿周期,并且采用当时业界最先进的0.13微米制程制作。

P4处理器3.06GHz

2003年,英特尔发布前端总线为533MHz的Pentium 4 3.06GHz处理器,采用了0.13微米工艺技术,提供512K的二级缓存,核心由5500万个晶体管组成。

P4处理器至尊版3.20GHz

2004年初发布,该处理器可兼容现有的英特尔865和英特尔875芯片组家族产品以及标准系统内存。2MB三级高速缓存可以预先加载图形帧缓冲区或视频帧,以满足处理器随后的要求,使在访问内存和I/O设备时实现更高的吞吐率和更快的帧带率。最终,这可带来更逼真的游戏效果和改进的视频编辑性能。增强的CPU性能还可支持软件厂商创建完善的软件物理引擎,从而带来栩栩如生的人物动作和人工智能,使电脑控制的人物更加形象、逼真。

半年之后,2004年6月,英特尔发布了P4 3.4GHz处理器,该处理器支持超线程(HT)技术,采用0.13微米制程,具备512KB二级高速缓存、2MB三级高速缓存和800MHz系统前端总线速度。

Northwood是第二代产品,采用0.13微米制程,具有电压低、体积小、温度低的优点。接着就是Prescott(0.09微米),虽然这技术很新,不过由于效能提升并不明显,而且有过热的问题。后来英特尔又推出Hyper Threading技术,大大增加工作效率,让P4又成为市场宠儿。英特尔之后又推出Extreme Edition、含有Prestonia(原本给服务器用的Xeon核心)以及Gallatin(0.13微米Northwood外频提升改良版)核心的CPU。现在市场上的高阶Pentium 4则是Socket LGA 775的Prescott为主。

2005-2006年:双核处理器

2005年4月,英特尔的第一款双核处理器平台包括采用英特尔955X高速芯片组、主频为3.2GHz的英特尔奔腾处理器至尊版840,此款产品的问世标志着一个新时代来临了。双核和多核处理器设计用于在一枚处理器中集成两个或多个完整执行内核,以支持同时管理多项活动。英特尔超线程(HT)技术能够使一个执行内核发挥两枚逻辑处理器的作用,因此与该技术结合使用时,英特尔奔腾处理器至尊版840能够充分利用以前可能被闲置的资源,同时处理四个软件线程。

英特尔奔腾D处理器

5月,带有两个处理内核的英特尔奔腾D处理器随英特尔945高速芯片组家族一同推出,可带来某些消费电子产品的特性,例如:环绕立体声音频、高清晰度视频和增强图形功能。2006年1月,英特尔发布了Pentium D 9xx系列处理器,包括了支持VT虚拟化技术的Pentium D 960(3.60GHz)、950(3.40GHz)和不支持VT的Pentium D 945(3.4 GHz)、925(3GHz)(注:925不支持VT虚拟化技术)和915(2.80GHz)。

英特尔酷睿2双核处理器

2006年7月,英特尔公司面向家用和商用个人电脑与笔记本电脑,发布了十款全新英特尔酷睿2双核处理器和英特尔酷睿至尊处理器。英特尔酷睿2双核处理器家族包括五款专门针对企业、家庭、工作站和玩家(如高端游戏玩家)而定制的台式机处理器,以及五款专门针对移动生活而定制的处理器。英特尔酷睿2双核处理器设计用于提供出色的能效表现,并更快速地运行多种复杂应用,支持用户改进各种任务的处理,例如:更流畅地观看和播放高清晰度视频;在电子商务交易过程中更好地保护电脑及其资产;以及提供更耐久的电池使用时间和更加纤巧时尚的笔记本电脑外形。

全新处理器可实现高达40%的性能提升,其能效比最出色的英特尔奔腾处理器高出40%。英特尔酷睿2双核处理器包含2.91亿个晶体管。不过,Pentium D谈不上是一套完美的双核架构,Intel只是将两个完全独立的CPU核心做在同一枚芯片上,通过同一条前端总线与芯片组相连。两个核心缺乏必要的协同和资源共享能力,而且还必须频繁地对二级缓存作同步化刷新动作,以避免两个核心的工作步调出问题。从这个意义上说,Pentium D带来的进步并没有人们预想得那么大!

2011年:重新确定处理器产品架构

2011年3月,使用32nm工艺全新桌面级和移动端处理器采用了i3、i5和i7的产品分级架构。其中i3主攻低端市场,采用双核处理器架构,约2MB二级缓存;i5处理器主攻主流市场,采用四核处理器架构,4MB二级缓存;i7主攻高端市场,采用四核八线程或六核十二线程架构,二级缓存不少于8MB。

2012年:发布22纳米工艺和第三代处理器

使用22nm工艺的处理器热功耗普遍小于77W,使得处理器的散热需求大幅下降,提升了大规模数据运算的可靠性,并降低了散热功耗。

2014年:首发桌面级8核心16线程处理器

2014年9月上市的i7-5960X处理器是第一款基于22nm工艺的八核心桌面级处理器,拥有高达20MB的三级缓存,主频达到3.5GHz,热功耗140W。此处理器的处理能力可谓超群,浮点数计算能力是普通办公电脑的10倍以上。随着这一“怪兽”处理器的问世,Intel公司在处理器领域与AMD的差距越拉越大,已经完全形成了一家独大的局面。

寻址空间发展表

摘自 寻访x86处理器“实模式”和“保护模式”的前世今生

![处理器地址线发展.png](/images/Intel CPU 发展简史/处理器地址线发展.png)

参考资料:

Intel CPU发展简史