再谈Intel CPU微结构–过去,现在和将来 : 弯曲评论

来源:百度文库 编辑:神马文学网 时间:2024/04/29 08:53:04

再谈Intel CPU微结构–过去,现在和将来

【陈怀临注:时光如梭。上次写这篇文章是2008年10月。转眼2年过去。这次做一些修订和校注。】

Intel CPU的产品称呼比较混乱。这一点对于在Intel工作的员工也是如此。下面是笔者在这方面的一些经验。希望对读者同学们有所帮助。

首先,对非专业人士而言,接触的名称通常为CPU的产品品牌(Brand Name),而不是微结构(Micro-Architecture)名称。什么是微结构?就是你看不见的那些东西。例如流水线(Pipeline)的设计,局部总线(Local Bus),缓存(Cache)的设计,存储总线(Memory Bus)等。到目前为止,一般而言,Intel CPU微结构的系列为:i386, i486, P5, P6, Netburst, Pentium-M,Core(Merom 65nm和 Penryn 45nm)。Core微结构的65nm流片有:Merom,Concore,Allendale等;45nm的流片Penryn,Workfiled,Yorkfield等。Penryn是Merom的直系后代。Nehalem是基于Penryn 45纳米流程的直系后代。从Penryn 45nm工艺流程的基础上,Nehalem微结构横空出世。在Nehalem与Core微结构的继承性上,目前英文的wiki上是不精确的。Nehalem最大的特点就是FSB和(或)北桥的消失,QPI的引入和把在Core微结构抛弃(或曰暂停的)HyperThreading从新引入。 Nehalem之后的事情比较清爽:Nehalem, Westmere(Nehalem在32nm工艺下的Tick ),Sandy Bridge,Ivy Bridge(Sandy Bridge在28nm 工艺下的Tick)和Haswell。通常,我们也可以说Nehalem和Westmere都属于Nehalem微结构。Sandy Bridge和Ivy Bridge都属于广义的Sandy Bridge微结构。这种关系就是Intel现在非常重要的Tick Tock的流程。如下图所示,为Intel的TT模型。

Tick其实就是Introduce一个新的工艺和各种PROCESS。Tock就是Introduce一个新的微结构。

工艺与结构的拆分对于Intel这些年来的成功是根本的。这里面的原因其实也很简单:如果一个芯片建立在一个新的工艺 AND又是一个新的微结构上。一旦出了问题,基本上整个公司就歇了一半了。CEO就要买豆腐撞死。没有Baseline的事情,最好不要去做。所以TT模式可以你确保,在一个已经酒精考验的PROCESS下,Tock一下,如果芯片有问题,那就基本上是新的结构出了问题。如果一个基于考验过的微结构在一个新的工艺下(Tick一下),如果芯片有问题,显然是工艺方面有bug。。。。总而言之,这样一个拿着billion美金烧出来的芯片,就可控了。。。

另外,TT模型的另外一个好处就是把工程师队伍有效的运作起来。例如,Core的Merom和Pennyn都是Intel以色列团队主导做的;然后Nehalem和Westmere是美国Oregon团队做的;然后Sandy Bridge和Ivy Bridge又是犹太人主导;再下面再是美国团队做。TT下去,循环往复。。

Intel在这个方面是从血的教训里学来的。当年的最新的NetBurst redesign Prescott在90nm就是Tick(90nm
新工艺与Tock(x86-64Extension)在一起了。一通混战之后,最后发现是Power Leakage问题无法解决,从而导致Intel彻底放弃NetBurst,从新捡起P6微结构。。。

所以,Intel的微结构变化可以简单概括为:
i386, i486, P5, P6, Netburst, Pentium-M,Core(Merom,Penryn ),Nehalem(Nehalem, Westmere), Sandy Bridge(Sandy Bridge, Ivy Bridge), Haswell(Haswell, Rockwell)。
从下面这张Intel解释其Tick Tock的图中读者也可以清晰的认识到这些微结构的家族关系:

多个CPU产品可以来源于同一个微结构。其意思是一代产品。属于同一个微结构的多款CPU基本上可以认为是同一类,或同一代产品。同一个微结构下的多款CPU的原因很多,例如,简单化的版本;某个特定市场的定制版本等。

同一个名称的CPU可以是来自不同的微结构。如Celeron CPU有P6微结构的,Netburst微结构的,Pentium-M微结构的和Core微结构的。如果不懂的话,您购买了一个Netburst微结构的Celeron,在性能价格比上就不好了。在同年代中,您当然应该选择Pentium-M的款式。对Intel的Xeon名称的CPU也一样,读者可以发现,Xeon可以来自不同的微结构技术。

因此,CPU的产品名称基本上没有用。一定要知道其来自哪个微结构。换言之,CPU名称与微结构的映射关系是M:N。

这些微结构名词与我们日常看到的广告上的“Inside Intel”的名称的关系如下:

(本文不讨论IA64体系结构。笔者认为IA64除了在科学计算方面,基本上没有任何意义了。)

<微结构名称>: {CPU品牌(Brand)}+

i386: 80386DX, 80386SX, 80376, 80386SL, 80386EX

i486: 80486DX, 80486SX, 80486DX2, 80486SL, 80486DX4

P5: Pentium, Pentium with MMX

P6: Pentium Pro, Pentium II, Celeron (Pentium II-based), Pentium III, Pentium II and III Xeon, Celeron (Pentium III Coppermine-based), Celeron (Pentium III Tualatin-based)

Netburst:(32位)Pentium 4, Xeon, Mobile Pentium 4-M, Pentium 4 EE, Pentium 4E, Pentium 4F,(64位)Pentium D, Pentium Extreme Edition, Xeon

Pentium-M:Pentium M, Celeron M, Intel Core, Dual-Core Xeon LV, Intel Pentium Dual-Core

Core:(64位)Xeon, Intel Core 2, Pentium Dual Core, Celeron M

Nehalem:Xeon, Core i7,Core i7 Extreme,Core i5。

Westmere:Xeon, Core i7,Core i7 Extreme,Core i5, Core i3,Pentium,Celeron

在基于Nehalem微结构下45nm工艺下流片的CPU有:

Nehalem(45nm)

桌面(Desktop)
Bloomfield (4核,8线程)
Lynnfield(4核,8线程)//存在4/4,无HyperThreading变种
Clarkfield(4核,8线程)

服务器(Server)
Nehalem-EX(8核,16线程)(Beckton)
Nehalem-EP(4核,8线程)(Gainestown) //存在4/4,2/2无HyperThreading变种

下图是Nehalem-EX和Nehalem-EP的结构比较图:

Westmere(32nm)

Westmere-EX (还没有出来。应该10个核,20个线程)
Westmere-EP(6核,12线程)(Gulftown)//存在4/8,4/4变种。XEON 5690为6/12.
Clarkdale(2核,4线程和加了一个45nm的iGFX)//其实是两个die。一个package。
Arrandale(2和,4线程和加了一个45nm的图形卡iGFX)。//其实是两个die。一个package。

下图所示为Westmere的Clarkdale的芯片图。一个Package,二个Die。CPU Die是32nm;Graphic芯片是45nm。换言之,就是混在一起完事交差。读者想想马上要出来的无缝的Sandy Bridge的GPU集成,就知道其中之区别了。


Sandy Bridge估计是明年上市。首发(希望不要交钱或者给什么芯片协会黑金)是2核和4核的。之后会慢慢的温水煮青蛙,8核和10核的都往外涌。。。如果一旦Intel把Steve Jobs拿下,NVDA的GPU出局。天可怜目前6B的NVDA。。。估计最后下场与AMD会差不多。

下图所示为Sand Bridge的Die图。与Westmere + GPU的双芯片(Die)解决方案,我们可以看见,GPU Seamlessly进来了。。。

(5个打分, 平均:5.00 / 5)

工具箱
本文链接 |邮给朋友 | 打印此页 | 11条用户评论 »