传统上,通用微处理器的工作负载以非数值、不规则标量应用为主(这种负载也是目前事务处理和Web服务类服务器的工作负载特征),实现高性能的方法主要是开发指令级并行性(ILP, instruction-level parallelism)。 以Intel x86为代表的CISC体系结构以超流水结构为提高性能的主要手段给人们留下了深刻的印象,这种结构将指令流水线划分成更简单的流水级以提高时钟速率。目前,Pentium IV的流水线级数对定点运算已达20级,浮点运算达到29级,处于执行状态的指令数达到126条。而RISC芯片则采用超标量结构为提高处理器性能的主要手段,这种结构在指令界面上保持与RISC结构兼容,但在内部由硬件做动态调度,实现多个操作的并行执行。为了进一步提高性能,CISC与RISC微处理器在发展的过程中都从对方借鉴了很多东西,两者在体系结构上的界限已越来越模糊。 RISC微处理器在进入后RISC时代以后,其性能的进一步提高,已不再是通过体系结构的创新得到的,而是用提高复杂度换来的。这种以复杂度换取性能的做法现在已达到收益递减点,效果已不再显著并且带来了很多问题。
IBM、HP(COMPAQ)、SGI、SUN等公司都生产各具特点的服务器用高性能通用微处理器,这些微处理器都采用RISC指令系统,通过超标量、乱序执行、动态分支预测、推测执行等机制,提高指令级并行性,改善性能。这类芯片被广泛用于各种工作站、服务器和高性能计算机中。
另外,Intel和HP公司早在1994年就启动了设计和生产基于EPIC显式并行体系结构的IA-64芯片合作项目,并陆续推出了Itanium和Itanium II处理器。有人预计不久,IA-64对服务器市场的占有量将全面超过RISC,以后IA-64标准也会形成,Intel将会主导这个标准。但是这些并不意味着IA-64将最终代替RISC体系结构而一统天下。Intel自己估计,要到2005甚至2010年,基于Itanium的64位的计算平台才会成为主流。同时,IBM、SUN等一些实力雄厚的公司,仍在继续发展新的基于RISC体系结构的芯片。
2001年8月Intel采用0.18μm工艺实现了主频为2GHz的Pentium IV芯片,目前生产的Pentium IV芯片则大都采用0.13μm工艺,主频已超过3GHz。AMD公司的Athlon K系列微处理器与Intel的Pentium系列二进制兼容,是Intel公司的强劲对手,现在的AMD Athlon处理器的主频也超过了1GHz,并且即使频率略低,在实际性能上却并不逊色。AMD的AMD-64处理器,在实现与IA-32兼容的同时,支持全64位计算,更展示了强劲的潜力。另外,VIA公司通过购并Cyrix公司,也开始生产与Pentium系列二进制兼容的微处理器芯片。目前,VIA的C3芯片已开始进入桌面系统的低端市场。
LED视频处理器又叫画面处理器,图像转换器,视频控制器,画面分割器,拼接器,图像处理器,画面转换器,视音频转换器,独立视频源,视频格式转换器。LED视频处理器是LED全彩显示屏诞生、成长以及成熟的全程...
拼接处理器很贵,视频处理器很便宜! 拼接处理器是专业VGA视频处理与控制设备,主要功能把一路视频/VGA的信号数码化分割为四个显示单元后,并以高分辨率VGA格式分配输出到四个大屏幕电视&...
凌动处理器是Intel针对超便携本本市场推出的专用处理器,主打的就是低功耗。网上查的话就可以看到仅2.5W。 性能只能说是一般,但足以满足一般需求。除了玩大型游戏、图形处理外...
提高指令级并行度是微处理器体系结构发展的重要方向,也是开发基于FPGA的高性能微处理器的重要内容之一。本文论述了一个基于FPGA的流水线微处理器的指令流水线结构和系统设计,针对在指令流水执行过程中出现的相关问题,提出了相应的检查算法及解决方法。通过一个典型程序对流水线微处理器功能进行仿真,其运行结果表明此微处理器的最大吞吐率为一个时钟周期解释完一条指令,证实了流水线微处理器设计的正确性和高性能。该微处理器的设计在开发未来具有微处理功能的专用集成电路设计方面具有较高的实用价值。
本文介绍了一台手动操作的钢板冲孔机,从手动到硬连线数控,然后又到微处理器数控的改造过程,显示了微机数控的优越性。
根据微处理器的应用领域,微处理器大致可以分为三类:通用高性能微处理器、嵌入式微处理器和数字信号处理器、微控制器。一般而言,通用处理器追求高性能,它们用于运行通用软件,配备完备、复杂的操作系统;嵌入式微处理器强调处理特定应用问题的高性能,主要用于运行面向特定领域的专用程序,配备轻量级操作系统,主要用于蜂窝电话、CD播放机等消费类家电;微控制器价位相对较低,在微处理器市场上需求量最大,主要用于汽车、空调、自动机械等领域的自控设备。
CPU是Central Processing Unit(中央微处理器)的缩写,它是计算机中最重要的一个部分,由运算器和控制器组成。如果把计算机比作人,那么CPU就是人的大脑。CPU的发展非常迅速,个人电脑从8088(XT)发展到Pentium 4时代,只经过了二十一年的时间。
微处理器由算术逻辑单元(ALU,Arithmetic Logical Unit);累加器和通用寄存器组;程序计数器(也叫指令指标器);时序和控制逻辑部件;数据与地址锁存器/缓冲器;内部总线组成。其中运算器和控制器是其主要组成部分。
算术逻辑单元ALU主要完成算术运算( ,-、×、÷、比较)和各种逻辑运算(与、或、非、异或、移位)等操作。ALU是组合电路,本身无寄存操作数的功能,因而必须有保存操作数的两个寄存器:暂存器TMP和累加器AC,累加器既向ALU提供操作数,又接收ALU的运算结果。
寄存器阵列实际上相当于微处理器内部的RAM,它包括通用寄存器组和专用寄存器组两部分,通用寄存器(A,B,C,D)用来存放参加运算的数据、中间结果或地址。它们一般均可作为两个8位的寄存器来使用。处理器内部有了这些寄存器之后,就可避免频繁地访问存储器,可缩短指令长度和指令执行时间,提高机器的运行速度,也给编程带来方便。专用寄存器包括程序计数器PC、堆栈指示器SP和标志寄存器FR,它们的作用是固定的,用来存放地址或地址基值。其中:
A)程序计数器PC用来存放下一条要执行的指令地址,因而它控制着程序的执行顺序。在顺序执行指令的条件下,每取出指令的一个字节,PC的内容自动加1。当程序发生转移时,就必须把新的指令地址(目标地址)装入PC,这通常由转移指令来实现。
B)堆栈指示器SP用来存放栈顶地址。堆栈是存储器中的一个特定区域。它按“后进先出”方式工作,当新的数据压入堆栈时,栈中原存信息不变,只改变栈顶位置,当数据从栈弹出时,弹出的是栈顶位置的数据,弹出后自动调正栈顶位置。也就是说,数据在进行压栈、出栈操作时,总是在栈顶进行。堆栈一旦初始化(即确定了栈底在内存中的位置)后,SP的内容(即栈顶位置)使由CPU自动管理。
C)标志寄存器也称程序状态字(PSW)寄存器,用来存放算术、逻辑运算指令执行后的结果特征,如结果为0时,产生进位或溢出标志等。
定时与控制逻辑是微处理器的核心控制部件,负责对整个计算机进行控制、包括从存储器中取指令,分析指令(即指令译码)确定指令操作和操作数地址,取操作数,执行指令规定的操作,送运算结果到存储器或I/O端口等。它还向微机的其它各部件发出相应的控制信号,使CPU内、外各部件间协调工作。
内部总线用来连接微处理器的各功能部件并传送微处理器内部的数据和控制信号。
必须指出,微处理器本身并不能单独构成一个独立的工作系统,也不能独立地执行程序,必须配上存 储器、输入输出设备构成一个完整的微型计算机后才能独立工作。
微型计算机的存储器用来存放当前正在使用的或经常使用的程序和数据。存储器按读、写方式分为随机存储器RAM(Random Access Memory)和只读存储器ROM(Read only Memory)。RAM也称为读/写存储器,工作过程中CPU可根据需要随时对其内容进行读或写操作。RAM是易失性存储器,即其内容在断电后会全部丢失,因而只能存放暂时性的程序和数据。ROM的内容只能读出不能写入,断电后其所存信息仍保留不变,是非易失性存储器。所以ROM常用来存放永久件的程序和数据。如初始导引程序、监控程序、操作系统中的基本输入、输出管理程序BIOS等。
输入/输出接口电路是微型计算机的重要组成部件。他是微型计算机连接外部输入、输出设备及各种控制对象并与外界进行信息交换的逻辑控制电路。由于外设的结构、工作速度、信号形式和数据格式等各不相同,因此它们不能直接挂接到系统总线上,必须用输入/输出接口电路来做中间转换,才能实现与CPU间的信息交换。I/O接口也称I/O适配器,不同的外设必须配备不同的I/O适配器。I/O接口电路是微机应用系统必不可少的重要组成部分。任何一个微机应用系统的研制和设计,实际上主要是I/O接口的研制和设计。因此I/O接口技术是本课程讨论的重要内容之一,我们将在第八章中详细介绍。
总线是计算机系统中各部件之间传送信息的公共通道,是微型计算机的重要组成部件。它由若干条通信线和起驱动,隔离作用的各种三态门器件组成。微型计算机在结构形式上总是采用总线结构,即构成微机的各功能部件(微处理器、存储器、I/O接口电路等)之间通过总线相连接,这是微型计算机系统结构上的独特之处。采用总线结构之后,使系统中各功能部件间的相互关系转变为各部件面向总线的单一关系,一个部件(功能板/卡)只要符合总线标准,就可以连接到采用这种总线标准的系统中,从而使系统功能扩充或更新容易、结构简单、可靠性大大提高。在微型计算机中,根据他们所处位置和应用场合,总线可被分为以下四级,如图1.4所示。
(1)片内总线:它位于微处理器芯片内部,故称为芯片内部总线。用于微处理器内部ALU和各种寄存器等部件间的互连及信息传送(如图1.3中的内部总线就是片内总线)。由于受芯片面积及对外引脚数的限制,片内总线大多采用单总线结构,这有利于芯片集成度和成品率的提高,如果要求加快内部数据传送速度,也可采用双总线或三总线结构。
(2)片总线:片总线又称元件级(芯片级)总线或局部总线。微机主板、单扳机以及其它一些插件板、卡(如各种I/O接口板/卡),它们本身就是一个完整的子系统,板/卡上包含有CPU,RAM,ROM,I/O接口等各种芯片,这些芯片间也是通过总线来连接的,因为这有利于简化结构,减少连线,提高可靠性,方便信息的传送与控制。通常把各种板、卡上实现芯片间相互连接的总线称为片总线或元件级总线。
相对于一台完整的微型计算机来说,各种板/卡只是一个子系统,是一个局部,故又把片总线称为局部总线,而把用于连接微机各功能部件插卡的总线称为系统总线。局部总线是一个重要的概念,我们将在第七章中讨论。
(3)内总线:内总线又称系统总线或板级总线。因为该总线是用来连接微机各功能部件而构成一个完整微机系统的,如图1.2中所示,所以称之为系统总线。系统总线是微机系统中最重要的总线,人们平常所说的微机总线就是指系统总线,如PC总线、AT总线(ISA总线)、PCI总线等。系统总线是我们要讨论的重点内容之一。
系统总线上传送的信息包括数据信息、地址信息、控制信息,因此,系统总线包含有三种不同功能的总线,即数据总线DB(Data Bus)、地址总线AB(Address Bus)和控制总线CB(Control Bus),如图1.2中所示。
数据总线DB用于传送数据信息。数据总线是双向三态形式的总线,即他既可以把CPU的数据传送到存储器或I/O接口等其它部件,也可以将其它部件的数据传送到CPU。数据总线的位数是微型计算机的一个重要指标,通常与微处理的字长相一致。例如Intel 8086微处理器字长16位,其数据总线宽度也是16位。需要指出的是,数据的含义是广义的,它可以是真正的数据,也可以指令代码或状态信息,有时甚至是一个控制信息,因此,在实际工作中,数据总线上传送的并不一定仅仅是真正意义上的数据。
地址总线AB是专门用来传送地址的,由于地址只能从CPU传向外部存储器或I/O端口,所以地址总线总是单向三态的,这与数据总线不同。地址总线的位数决定了CPU可直接寻址的内存空间大小,比如8位微机的地址总线为16位,则其最大可寻址空间为2^16=64KB,16位微型机的地址总线为20位,其可寻址空间为2^20=1MB。一般来说,若地址总线为n位,则可寻址空间为2^n字节。
控制总线CB用来传送控制信号和时序信号。控制信号中,有的是微处理器送往存储器和I/O接口电路的,如读/写信号,片选信号、中断响应信号等;也有是其它部件反馈给CPU的,比如:中断申请信号、复位信号、总线请求信号、限备就绪信号等。因此,控制总线的传送方向由具体控制信号而定,一般是双向的,控制总线的位数要根据系统的实际控制需要而定。实际上控制总线的具体情况主要取决于CPU。
(4)外总线:也称通信总线。用于两个系统之间的连接与通信,如两台微机系统之间、微机系统与其他电子仪器或电子设备之间的通信。常用的通信总线有IEEE-488总线,VXI总线和RS-232串行总线等。外总线不是微机系统本身固有的,只有微型机应用系统中才有。
CPU发展已经有多年的历史了,这期间,按照其处理信息的字长,CPU可以分为:4位微处理器、8位微处理器、16位微处理器、32位微处理器以及最新的64位微处理器,可以说个人电脑的发展是随着CPU的发展而前进的。微机是指以大规模、超大规模集成电路为主要部件,以集成了计算机主要部件——控制器和运算器的微处理器MP(Micro Processor)为核心,所构造出的计算系经过30多年的发展,微处理器的发展大致可分为:
第一阶段
(1971—1973年)通常以字长是4位或8位微处理器,典型的是美国 Intel 4004和Intel 8008微处理器。Intel 4004是一种4位微处理器,可进行4位二进制的并行运算,它有45条指令,速度0.05MIPs(Million Instruction Per Second,每秒百万条指令)。Intel 4004的功能有限,主要用于计算器、电动打字机、照相机、台秤、电视机等家用电器上,使这些电器设备具有智能化,从而提高它们的性能。Intel 8008是世界上第一种8位的微处理器。存储器采用PMOS工艺。该阶段计算机工作速度较慢,微处理器的指令系统不完整,存储器容量很小,只有几百字节,没有操作系统,只有汇编语言。主要用于工业仪表、过程控制。
(1974—1977年)典型的微处理器有Intel 8080/8085,Zilog公司的Z80和Motorola公司的M6800。与第一代微处理器相比,集成度提高了1~4倍,运算速度提高了10~15倍,指令系统相对比较完善,已具备典型的计算机体系结构及中断、直接存储器存取等功能。
由于微处理器可用来完成很多以前需要用较大设备完成的计算任务,价格又便宜,于是各半导体公司开始竞相生产微处理器芯片。Zilog公司生产了8080的增强型Z80,摩托罗拉公司生产了6800,英特尔公司于1976年又生产了增强型8085,但这些芯片基本没有改变8080的基本特点,都属于第二代微处理器。它们均采用NMOS工艺,集成度约9000只晶体管,平均指令执行时间为1μS~2μS,采用汇编语言、BASIC、Fortran编程,使用单用户操作系统。
第三阶段(1978—1984年)即16位微处理器。1978 年,Intel公司率先推出16位微处理器8086,同时,为了方便原来的8位机用户,Intel公司又提出了一种准16位微处理器8088。
8086微处理器最高主频速度为8MHz,具有16位数据通道,内存寻址能力为1MB。同时英特尔还生产出与之相配合的数学协处理器i8087,这两种芯片使用相互兼容的指令集,但i8087指令集中增加了一些专门用于对数、指数和三角函数等数学计算的指令。人们将这些指令集统一称之为 x86指令集。虽然以后英特尔又陆续生产出第二代、第三代等更先进和更快的新型CPU,但都仍然兼容原来的x86指令,而且英特尔在后续CPU的命名上沿用了原先的x86序列,直到后来因商标注册问题,才放弃了继续用阿拉伯数字命名。
1979年,英特尔公司又开发出了8088。8086和8088在芯片内部均采用16位数据传输,所以都称为16位微处理器,但8086每周期能传送或接收16位数据,而8088每周期只采用8位。因为最初的大部分设备和芯片是8位的,而8088的外部8位数据传送、接收能与这些设备相兼容。8088采用40针的DIP封装,工作频率为6.66MHz、7.16MHz或8MHz,微处理器集成了大约29000个晶体管。
在Intel公司推出8086、8088 CPU之后,各公司也相继推出了同类的产品,有Zilog公司Z8000和Motorola公司的M68000等。16位微处理器比8位微处理器有更大的寻址空间、更强的运算能力、更快的处理速度和更完善的指令系统。所以,16位微处理器已能够替代部分小型机的功能,特别在单任务、单用户的系统中,8086等16位微处理器更是得到了广泛的应用。
1981年,美国IBM公司将8088芯片用于其研制的IBM-PC机中,从而开创了全新的微机时代。也正是从8088开始,个人电脑(PC)的概念开始在全世界范围内发展起来。从8088应用到IBM PC机上开始,个人电脑真正走进了人们的工作和生活之中,它也标志着一个新时代的开始。
1982年,英特尔公司在8086的基础上,研制出了80286微处理器,该微处理器的最大主频为20MHz,内、外部数据传输均为16位,使用24位内存储器的寻址,内存寻址能力为16MB。80286可工作于两种方式,一种叫实模式,另一种叫保护方式。
在实模式下,微处理器可以访问的内存总量限制在1兆字节;而在保护方式之下,80286可直接访问16兆字节的内存。此外,80286工作在保护方式之下,可以保护操作系统,使之不像实模式或8086等不受保护的微处理器那样,在遇到异常应用时会使系统停机。
IBM公司将80286微处理器用在先进技术微机即AT机中,引起了极大的轰动。80286在以下四个方面比它的前辈有显著的改进:支持更大的内存;能够模拟内存空间;能同时运行多个任务;提高了处理速度。
最早PC机的速度是4MHz,第一台基于80286的AT机运行速度为6MHz至8MHz,一些制造商还自行提高速度,使80286达到了20MHz,这意味着性能上有了重大的进步。
80286的封装是一种被称为PGA的正方形包装。PGA是源于PLCC的便宜封装,它有一块内部和外部固体插脚,在这个封装中,80286集成了大约130000个晶体管。
IBM PC/AT微机的总线保持了XT的三层总线结构,并增加了高低位字节总线驱动器转换逻辑和高位字节总线。与XT机一样,CPU也是焊接在主板上的。
第四阶段(1985—1992年)即32位微处理器。1985年10月17日,英特尔划时代的产品——80386DX正式发布了,其内部包含27.5万个晶体管,时钟频率为12.5MHz,后逐步提高到20MHz、25MHz、33MHz,最后还有少量的40MHz产品。
80386DX的内部和外部数据总线是32位,地址总线也是32位,可以寻址到4GB内存,并可以管理64TB的虚拟存储空间。它的运算模式除了具有实模式和保护模式以外,还增加了一种“虚拟86”的工作方式,可以通过同时模拟多个8086微处理器来提供多任务能力。
80386DX有比80286更多的指令,频率为12.5MHz的80386每秒钟可执行6百万条指令,比频率为16MHz的80286快2.2倍。80386最经典的产品为80386DX-33MHz,一般我们说的80386就是指它。
由于32位微处理器的强大运算能力,PC的应用扩展到很多的领域,如商业办公和计算、工程设计和计算、数据中心、个人娱乐。80386使32位CPU成为了PC工业的标准。
1989年英特尔公司又推出准32位微处理器芯片80386SX。这是Intel为了扩大市场份额而推出的一种较便宜的普及型CPU,它的内部数据总线为32位,外部数据总线为16位,它可以接受为80286开发的16位输入/输出接口芯片,降低整机成本。80386SX推出后,受到市场的广泛的欢迎,因为80386SX的性能大大优于80286,而价格只是80386的三分之一。
1989年,我们大家耳熟能详的80486芯片由英特尔推出。这款经过四年开发和3亿美元资金投入的芯片的伟大之处在于它首次实破了100万个晶体管的界限,集成了120万个晶体管,使用1微米的制造工艺。80486的时钟频率从25MHz逐步提高到33MHz、40MHz、50MHz。
80486是将80386和数学协微处理器80387以及一个8KB的高速缓存集成在一个芯片内。80486中集成的80487的数字运算速度是以前80387的两倍,内部缓存缩短了微处理器与慢速DRAM的等待时间。并且,在80x86系列中首次采用了RISC(精简指令集)技术,可以在一个时钟周期内执行一条指令。它还采用了突发总线方式,大大提高了与内存的数据交换速度。由于这些改进,80486的性能比带有80387数学协微处理器的80386 DX性能提高了4倍。
第5阶段(1993-2005年)是奔腾(pentium)系列微处理器时代,通常称为第5代。典型产品是Intel公司的奔腾系列芯片及与之兼容的AMD的K6系列微处理器芯片。内部采用了超标量指令流水线结构,并具有相互独立的指令和数据高速缓存。随着MMX(MultiMediaeXtended)微处理器的出现,使微机的发展在网络化、多媒体化和智能化等方面跨上了更高的台阶。
早期的奔腾75MHz~120MHz使用0.5微米的制造工艺,后期120MHz频率以上的奔腾则改用0.35微米工艺。经典奔腾的性能相当平均,整数运算和浮点运算都不错。 为了提高电脑在多媒体、3D图形方面的应用能力,许多新指令集应运而生,其中最著名的三种便是英特尔的MMX、SSE和AMD的3D NOW!。 MMX(MultiMedia Extensions,多媒体扩展指令集)是英特尔于1996年发明的一项多媒体指令增强技术,包括57条多媒体指令,这些指令可以一次处理多个数据,MMX技术在软件的配合下,就可以得到更好的性能。
多能奔腾(Pentium MMX)的正式名称就是“带有MMX技术的Pentium”,是在1996年底发布的。从多能奔腾开始,英特尔就对其生产的CPU开始锁倍频了,但是MMX的CPU超外频能力特别强,而且还可以通过提高核心电压来超倍频,所以那个时候超频是一个很时髦的行动。超频这个词语也是从那个时候开始流行的。
多能奔腾是继Pentium后英特尔又一个成功的产品,其生命力也相当顽强。多能奔腾在原Pentium的基础上进行了重大的改进,增加了片内16KB数据缓存和16KB指令缓存,4路写缓存以及分支预测单元和返回堆栈技术。特别是新增加的57条MMX多媒体指令,使得多能奔腾即使在运行非MMX优化的程序时,也比同主频的Pentium CPU要快得多。
1997年推出的Pentium II处理器结合了Intel MMX技术,能以极高的效率处理影片、音效、以及绘图资料,首次采用Single Edge Contact (S.E.C) 匣型封装,内建了高速快取记忆体。这款晶片让电脑使用者撷取、编辑、以及透过网际网络和亲友分享数位相片、编辑与新增文字、音乐或制作家庭电影的转场效果、使用视讯电话以及透过标准电话线与网际网络传送影片,Intel Pentium II处理器晶体管数目为750万颗。
Pentium III 处理器加入70个新指令,加入网际网络串流SIMD延伸集称为MMX,能大幅提升先进影像、3D、串流音乐、影片、语音辨识等应用的性能,它能大幅提升网际网络的使用经验,让使用者能浏览逼真的线上博物馆与商店,以及下载高品质影片,Intel首次导入0.25微米技术,Intel Pentium III晶体管数目约为950万颗。
与此同年,英特尔还发布了PentiumIII Xeon处理器。作为PentiumII Xeon的后继者,除了在内核架构上采纳全新设计以外,也继承了Pentium III处理器新增的70条指令集,以更好执行多媒体、流媒体应用软件。除了面对企业级的市场以外,Pentium III Xeon加强了电子商务应用与高阶商务计算的能力。在缓存速度与系统总线结构上,也有很多进步,很大程度提升了性能,并为更好的多处理器协同工作进行了设计。
2000年推出的Pentium 4处理器内建了4200万个晶体管,以及采用0.18微米的电路,Pentium 4初期推出版本的速度就高达1.5GHz,晶体管数目约为4200万颗,翌年8月,Pentium 4 处理理达到2 GHz的里程碑。2002年英特尔推出新款Intel Pentium 4处理器内含创新的Hyper-Threading(HT)超线程技术。超线程技术打造出新等级的高性能桌上型电脑,能同时快速执行多项运算应用,或针对支持多重线程的软件带来更高的性能。超线程技术让电脑性能增加25%。除了为桌上型电脑使用者提供超线程技术外,英特尔也达成另一项电脑里程碑,就是推出运作频率达3.06 GHz的Pentium 4处理器,是首款每秒执行30亿个运算周期的商业微处理器,如此优异的性能要归功于当时业界最先进的0.13微米制程技术,翌年,内建超线程技术的Intel Pentium 4处理器频率达到3.2 GHz。
PentiumM:由以色列小组专门设计的新型移动CPU,Pentium M是英特尔公司的x86架构微处理器,供笔记簿型个人电脑使用,亦被作为Centrino的一部分,于2003年3月推出。公布有以下主频:标准1.6GHz,1.5GHz,1.4GHz,1.3GHz,低电压1.1GHz,超低电压900MHz。为了在低主频得到高效能,Banias作出了优化,使每个时钟所能执行的指令数目更多,并通过高级分支预测来降低错误预测率。另外最突出的改进就L2高速缓存增至1MB(P3-M和P4-M都只有512KB),估计Banias数目高达7700万的晶体管大部分就用在这上。
此外还有一系列与减少功耗有关的设计:增强型Speedstep技术是必不可少的了,拥有多个供电电压和计算频率,从而使性能可以更好地满足应用需求。
智能供电分布可将系统电量集中分布到处理器需要的地方,并关闭空闲的应用;移动电压定位(MVPIV)技术可根据处理器活动动态降低电压,从而支持更低的散热设计功率和更小巧的外形设计;经优化功率的400MHz系统总线;Micro-opsfusion微操作指令融合技术,在存在多个可同时执行的指令的情况下,将这些指令合成为一个指令,以提高性能与电力使用效率。专用的堆栈管理器,使用记录内部运行情况的专用硬件,处理器可无中断执行程序。
Banias所对应的芯片组为855系列,855芯片组由北桥芯片855和南桥芯片ICH4-M组成,北桥芯片分为不带内置显卡的855PM(代号Odem)和带内置显卡的855GM(代号Montara-GM),支持高达2GB的DDR266/200内存,AGP4X,USB2.0,两组ATA-100、AC97音效及Modem。其中855GM为三维及显示引擎优化InternalClockGating,它可以在需要时才进行三维显示引擎供电,从而降低芯片组的功率。
2005年Intel推出的双核心处理器有Pentium D和Pentium Extreme Edition,同时推出945/955/965/975芯片组来支持新推出的双核心处理器,采用90nm工艺生产的这两款新推出的双核心处理器使用是没有针脚的LGA 775接口,但处理器底部的贴片电容数目有所增加,排列方式也有所不同。
桌面平台的核心代号Smithfield的处理器,正式命名为Pentium D处理器,除了摆脱阿拉伯数字改用英文字母来表示这次双核心处理器的世代交替外,D的字母也更容易让人联想起Dual-Core双核心的涵义。
Intel的双核心构架更像是一个双CPU平台,Pentium D处理器继续沿用Prescott架构及90nm生产技术生产。Pentium D内核实际上由于两个独立的2独立的Prescott核心组成,每个核心拥有独立的1MB L2缓存及执行单元,两个核心加起来一共拥有2MB,但由于处理器中的两个核心都拥有独立的缓存,因此必须保正每个二级缓存当中的信息完全一致,否则就会出现运算错误。
为了解决这一问题,Intel将两个核心之间的协调工作交给了外部的MCH(北桥)芯片,虽然缓存之间的数据传输与存储并不巨大,但由于需要通过外部的MCH芯片进行协调处理,毫无疑问的会对整个的处理速度带来一定的延迟,从而影响到处理器整体性能的发挥。
由于采用Prescott内核,因此Pentium D也支持EM64T技术、XD bit安全技术。值得一提的是,Pentium D处理器将不支持Hyper-Threading技术。原因很明显:在多个物理处理器及多个逻辑处理器之间正确分配数据流、平衡运算任务并非易事。比如,如果应用程序需要两个运算线程,很明显每个线程对应一个物理内核,但如果有3个运算线程呢?因此为了减少双核心Pentium D架构复杂性,英特尔决定在针对主流市场的Pentium D中取消对Hyper-Threading技术的支持。
同出自Intel之手,而且Pentium D和Pentium Extreme Edition两款双核心处理器名字上的差别也预示着这两款处理器在规格上也不尽相同。其中它们之间最大的不同就是对于超线程(Hyper-Threading)技术的支持。Pentium D不支持超线程技术,而Pentium Extreme Edition则没有这方面的限制。在打开超线程技术的情况下,双核心Pentium Extreme Edition处理器能够模拟出另外两个逻辑处理器,可以被系统认成四核心系统。
Pentium EE系列都采用三位数字的方式来标注,形式是Pentium EE8xx或9xx,例如Pentium EE840等等,数字越大就表示规格越高或支持的特性越多。
Pentium EE8x0:表示这是Smithfield核心、每核心1MB二级缓存、800MHzFSB的产品,其与PentiumD8x0系列的唯一区别仅仅只是增加了对超线程技术的支持,除此之外其它的技术特性和参数都完全相同。
Pentium EE9x5:表示这是Presler核心、每核心2MB二级缓存、1066MHzFSB的产品,其与PentiumD9x0系列的区别只是增加了对超线程技术的支持以及将前端总线提高到1066MHzFSB,除此之外其它的技术特性和参数都完全相同。
单核心的Pentium 4、Pentium 4 EE、Celeron D以及双核心的Pentium D和Pentium EE等CPU采用LGA775封装。与以前的Socket 478接口CPU不同,LGA 775接口CPU的底部没有传统的针脚,而代之以775个触点,即并非针脚式而是触点式,通过与对应的LGA 775插槽内的775根触针接触来传输信号。LGA 775接口不仅能够有效提升处理器的信号强度、提升处理器频率,同时也可以提高处理器生产的良品率、降低生产成本。
第6阶段(2005年至今)是酷睿(core)系列微处理器时代,通常称为第6代。“酷睿”是一款领先节能的新型微架构,设计的出发点是提供卓然出众的性能和能效,提高每瓦特性能,也就是所谓的能效比。早期的酷睿是基于笔记本处理器的。 酷睿2:英文名称为Core 2 Duo,是英特尔在2006年推出的新一代基于Core微架构的产品体系统称。于2006年7月27日发布。酷睿2是一个跨平台的构架体系,包括服务器版、桌面版、移动版三大领域。其中,服务器版的开发代号为Woodcrest,桌面版的开发代号为Conroe,移动版的开发代号为Merom。
酷睿2处理器的Core微架构是Intel的以色列设计团队在Yonah微架构基础之上改进而来的新一代英特尔架构。最显著的变化在于在各个关键部分进行强化。为了提高两个核心的内部数据交换效率采取共享式二级缓存设计,2个核心共享高达4MB的二级缓存。
继LGA775接口之后,Intel首先推出了LGA1366平台,定位高端旗舰系列。首颗采用LGA 1366接口的处理器代号为Bloomfield,采用经改良的Nehalem核心,基于45纳米制程及原生四核心设计,内建8-12MB三级缓存。LGA1366平台再次引入了Intel超线程技术,同时QPI总线技术取代了由Pentium 4时代沿用至今的前端总线设计。最重要的是LGA1366平台是支持三通道内存设计的平台,在实际的效能方面有了更大的提升,这也是LGA1366旗舰平台与其他平台定位上的一个主要区别。
作为高端旗舰的代表,早期LGA1366接口的处理器主要包括45nm Bloomfield核心酷睿i7四核处理器。随着Intel在2010年买入32nm工艺制程,高端旗舰的代表被酷睿i7-980X处理器取代,全新的32nm工艺解决六核心技术,拥有最强大的性能表现。对于准备组建高端平台的用户而言,LGA1366依然占据着高端市场,酷睿i7-980X以及酷睿i7-950依旧是不错的选择。
Intel Core i7是一款45nm原生四核处理器,处理器拥有8MB三级缓存,支持三通道DDR3内存。处理器采用LGA 1366针脚设计,支持第二代超线程技术,也就是处理器能以八线程运行。根据网上流传的测试,同频Core i7比Core 2 Quad性能要高出很多。
综合之前的资料来看,英特尔首先会发布三款Intel Core i7处理器,频率分别为3.2GHz、2.93GHz和2.66GHz,主频为3.2GHz的属于Intel Core i7 Extreme,处理器售价为999美元,当然这款顶级处理器面向的是发烧级用户。而频率较低的2.66GHz的定价为284美元,约合1940元人民币,面向的是普通消费者。全新一代Core i7处理器将于2013年第四季度推出。
而从英特尔技术峰会2008(IDF2008)上英特尔展示的情况来看,core i7的能力在core2 extreme qx9770(3.2GHz)的三倍左右。IDF上,intel工作人员使用一颗core i7 3.2GHz处理器演示了CineBench R10多线程渲染,结果很惊人。渲染开始后,四颗核心的八个线程同时开始工作,仅仅19秒钟后完整的画面就呈现在了屏幕上,得分超过45800。相比之下,core2 extreme qx 9770 3.2GHz只能得到一万两千分左右,超频到4.0GHz才勉强超过15000分,不到core i7的3分之一。core i7的超强实力由此可窥见一斑。
Core i5是一款基于Nehalem架构的四核处理器,采用整合内存控制器,三级缓存模式,L3达到8MB,支持Turbo Boost等技术的新处理器电脑配置。它和Core i7(Bloomfield)的主要区别在于总线不采用QPI,采用的是成熟的DMI(Direct Media Interface),并且只支持双通道的DDR3内存。结构上它用的是LGA1156 接口,Core i7用的是LGA1366。i5有睿频技术,可以在一定情况下超频。
Core i3可看作是Core i5的进一步精简版(或阉割版),将有32nm工艺版本(研发代号为Clarkdale,基于Westmere架构)这种版本。Core i3最大的特点是整合GPU(图形处理器),也就是说Core i3将由CPU GPU两个核心封装而成。由于整合的GPU性能有限,用户想获得更好的3D性能,可以外加显卡。值得注意的是,即使是Clarkdale,显示核心部分的制作工艺仍会是45nm。i3 i5 区别最大之处是 i3没有睿频技术。
2010年6月,Intel再次发布革命性的处理器——第二代Core i3/i5/i7。第二代Core i3/i5/i7隶属于第二代智能酷睿家族,全部基于全新的Sandy Bridge微架构,相比第一代产品主要带来五点重要革新:1、采用全新32nm的Sandy Bridge微架构,更低功耗、更强性能。2、内置高性能GPU(核芯显卡),视频编码、图形性能更强。 3、睿频加速技术2.0,更智能、更高效能。4、引入全新环形架构,带来更高带宽与更低延迟。5、全新的AVX、AES指令集,加强浮点运算与加密解密运算。
SNB(Sandy Bridge)是英特尔在2011年初发布的新一代处理器微架构,这一构架的最大意义莫过于重新定义了“整合平台”的概念,与处理器“无缝融合”的“核芯显卡”终结了“集成显卡”的时代。这一创举得益于全新的32nm制造工艺。由于Sandy Bridge 构架下的处理器采用了比之前的45nm工艺更加先进的32nm制造工艺,理论上实现了CPU功耗的进一步降低,及其电路尺寸和性能的显著优化,这就为将整合图形核心(核芯显卡)与CPU封装在同一块基板上创造了有利条件。此外,第二代酷睿还加入了全新的高清视频处理单元。视频转解码速度的高与低跟处理器是有直接关系的,由于高清视频处理单元的加入,新一代酷睿处理器的视频处理时间比老款处理器至少提升了30%。新一代Sandy Bridge处理器采用全新LGA1155接口设计,并且无法无LGA1156接口兼容。Sandy Bridge是将取代Nehalem的一种新的微架构,不过仍将采用32nm工艺制程。比较吸引人的一点是这次Intel不再是将CPU核心与GPU核心用“胶水”粘在一起,而是将两者真正做到了一个核心里。
在2012年4月24日下午北京天文馆,intel正式发布了ivy bridge(IVB)处理器。22nm Ivy Bridge会将执行单元的数量翻一番,达到最多24个,自然会带来性能上的进一步跃进。Ivy Bridge会加入对DX11的支持的集成显卡。另外新加入的XHCI USB 3.0控制器则共享其中四条通道,从而提供最多四个USB 3.0,从而支持原生USB3.0。cpu的制作采用3D晶体管技术的CPU耗电量会减少一半。