电脑之“芯”全攻略（六）

答案：
　　Cyrix

Cyrix 也算是一家老资格的CPU开发商了，早在X86时代，它和INTEL，AMD就形成了三雄并立的局面。自从INTEL另辟途径，开发了Pentium之后，CYRIX也很快推出了自己的新一代产品棗5X86。可能是CYRIX低估了独立研制一块CPU的难度吧，5X86可以说是一款失败的产品，没错，比起486来说性能是有所增加，可是比起Pentium来说，不但浮点性能远远不足，就连CYRIX一向自豪的整数运算性能也不那么高超，给人一种比上不足比下有余的感觉。有余5X86可以使用486的主板，因此我们一般将它看成是过渡产品。

后来CYRIX见势头不对，为了挽回面子，又匆匆推出了6X86系列的CPU，自从Cyrix与美国国家半导体公司合并后，使其终于拥有了自己的芯片生产线，其成品将会日益完善和完备。Cyrix的6x86是其投放到市场上的与Pentium兼容的处理器。它使用的是PR等级评定来进行CPU的标称。其PR-133CPU，运行在120MHZ，性能却同Pentium 133是相同的。但其发热量巨大。后期发布的是6x86LCPU，该CPU使用的是双电压设计，即核芯电压是3.3，I/O电压是5V。从而大大降低了CPU的温度，该档次的CPU，PR-200+使用的是75MHZ的外频在150MHZ的时候就提供了与Pentium 200相同的性能，可见CPU外频的重要性。到了MMX时代，Cyrix推出了他们的MX CPU，这一档次的CPU全是采用双电压设计，频率从166-233MHZ，到266-300时用MII来命名。Cyrix的MX CPU的整数性能是无与伦比的，但其MMX和FP性能和AMD一样，都比同档次的Pentium要差，MX的MMX和FP性能比K6还差，这些好像是Cyrix CPU的一贯特色。其MX的CPU发售的有60、66、75MHZ的几种，60MHZ的是测试版，66和75MHZ都是正式发行版，为什么有两种版本呢？因为当时Cyrix还没与美国国家半导体公司合并，其生产工艺还不过关，它就把上不了75MHZ的CPU标成同档次的66MHZ外频的来卖。

Cyrix作为非Intel阵营的另一个重要成员，1998年主要是在原有产品基础上进行改进，推出新的升级产品。1997年Cyrix曾推出了低价位和高集成度的Media GX，促进了1000美元以下PC机市场的兴起。Cyrix在1998年作的第一件事，就是把Media GX升级为具有MMX功能的版本。同时，Cyrix对它的拳头产品6X86MX作了进一步的改进，采用了新的名称MⅡ，并在1998年4月问世。MⅡ采用了更先进的技术，因此具有更快的内核速度和总线速度。

而为了继续向中、低端市场进攻，CYRIX又打算推出最新一代的CPU——Jalapeno。

Jalapeno的内部与6X86、6X86MX、MII等第六代芯片不相同，完全是一种新的架构。Cyrix发现了对机器性能有影响的内存反应周期瓶颈，于是使用芯片自带缓存/内存控制器与高速I/O接口，以及缩小芯片体积的方法，减少内存反应时间和增加数据传输带宽(3.2GB/秒)，从而加快了CPU的运算。Cyrix的方法有以下几种：二级I缓冲预示，2个不确定的预测命中；二级D缓冲预示，4个不确定的预测命中；独立地从DRAM中取得二级I错误和D错误(25~50%的二级错误预示，强制性错误时减少预示延迟，256KB做到512KB的工作)；自带内存控制器减少内核到DRAM的存取时间，使Socket7系统的存取时间达到20毫微秒(DRAM存取时间除外)，而普通的Socket 7/Slot 1总线只有50毫微秒；内存控制器有32个开放页，比一般的芯片组还要多；使用RDRAM(Rambus Direct RAM，直接型RambusRAM)。高速处理器受限于纵深管道和二级缓存，Jalapeno的11条纵深管道可达到GHz级，8路互联交叉256KB二级缓存能工作在与芯片相同的速度下，所以Jalapeno能拥有较高的时钟频率。另外，图形子系统会使用二级缓存来作纹理缓冲区，在进行3D图形应用时，全速的256KB L2 Cache甚至可以比得上传统的512KB L2 Cache。

Jalapeno的新浮点单元是个双重FPU/MMX结构，它包括了两个完整的指令管道，独立的X87加法器和乘法器，因而两个FPU都支持MMX和3DNow!指令，而且它们不会相互干扰。新内核还集成了3D图形引擎，这是Cyrix第一次利用双重FPU来对图形子系统作优化，再加上CPU内部集成的3D图形控制器，使Jalapeno得到了极强的三维应用能力。因为M3使用了UMA(Unified Memory Architecture，统一内存架构)，所以无须再购买图形帧缓存，而且GART(Graphic Address Remappng Table，图形地址重绘表)的速度也比帧缓冲快，可谓少花钱办大事。同时，它亦运用了NS(National SemicondUCtor，国家半导体)的Mediamatics多媒体辅助技术，增强了DVD的播放。

下面是Jalapeno的详细内部结构：

一，Jalapeno的X86内核技术参数：

1，双重X86注册重命名和乱序执行(2个整数单元、2个FP/MMX单元、1个分支单元和1个读取/存储单元)

2，11个纵深管道(使用0.18微米工艺，时钟频率可达600MHz，芯片面积为110~120平方毫米，由NS的南波特兰市实验室研制)

3，分支预测(1K入口，拥有7位历史记录和预测ROM的4路BTB，16K返回堆栈入口)

4，16KB，4路IC，2个不确定的预测命中

5，16KB，4路双端口DC，4个不确定的预测命中

6，256KB，8路二级缓存，8个不确定的预测命中

二，Jalapeno的指令解码步骤：

1，从BTB中取得下一条预测指令。

2，IC和缓冲区流出32字节的数据。

3，上行的2个完全X86指令进行检验和缓冲(先上行2个位于前面的字节，这个过程没有缓冲预先确定的数据位数)。

4，解码和流出要运算的数据(本过程仅用了1个内存操作周期)。

5，指令解码到内核中。

三，节点数据发送

1，每条指令将映射到1，2或更多的节点中(每个节点包含来源地址、目标地址和控制代码)。

2，数据将并列地上行到2EX、1AC、1BR和2 FPU节点中。

3，大多数指令都可以通过两个并行处理单元双重流出(这些指令包括padd reg,mem/pand reg,reg；faddreg,reg/fmul reg,reg; add mem,reg/shl reg,reg; cmp reg,mem/jcc)。

4，每个节点由检查、重命名、流出并执行等几个单元组成。

5，Jalapeno内共有16个检查点(96节点)。

四，分支处理

1，独立的分支单元(可获得更多的内核带宽)。

2，标记结果以产生乱序指令。

3，按顺序执行分支。

4，在分支执行和开始改正错误时把其它错误分离。

5，在12个时钟周期内改正错误。

6，分支执行后刷新BTB。

五，整数运算单元

1，完全管道架构。

2，大部分执行指令和结果都能在1个时钟周期内到达双处理单元。RCL/RCR/BSF/BSR需要2个时钟周期，整数乘法(MMX乘法)需要8~12个时钟周期，整数除-1的每位商结果需要1个时钟周期。

3，使用整数乘法和除法对整数进行并列执行操作。

4，快速地把整数变换成FPU/MMX结果。

六，FP/MMX单元

1，完全管道型X87加法器，4/1

2，完全管道型X87乘法器，5/1

3，FDIV 23(SP),33(DP,EP)

4，双重单元同时支持MMX和3DNow(MMX：1/1，转换：2/1，mul 4/1；3DNow：3/1，pfrcp/pfsqrt/pfmul：5/1)

七，读取/存储单元

1，单精度型读取/存储单元的特点有：16KB，4路，非模块型数据缓冲(3周期存取，1周期读入，1周期存储/载满数据)；32入口，完全联合型一级DTLB；512入口，8路二级TLB(Translate Look side Buffers，翻译旁视缓冲器)；12入口的数据存储序列。

2，按请求顺序传输数据。

3，数据可上行到4个一级不确定预测单元(预测错误的数据将变回无序状态)。

4，数据可按序补充到执行单元中

八，二级缓存

1，256KB，8路联合，8路交叉存取

2，每时钟周期交叉存取可支持：1个一级预测错误或1个一级存储或二级载满。

3，所有管道都运行于同内核一样的频率下

4，从一级缓存到二级缓存有7时钟周期的存取反应时间。

5，256位一级缓存重新载满(非后置式载入)

6，充许用真实代码或运行图形引擎时锁住二级缓存。

九，图形性能及特性

1，3百万个多边形/秒、266M像素/秒，时钟频率230MHz

2，支持Direct3D等工业标准API，雾化，Alpha混合，反混和(Anti-Aliasing)，各向异性纹理过滤(Anisotropic Texture Filtering)，集成MPEG2/DVD回放。

综上所述，Jalapeno系统性能的增强得益于它的新X86内核，256KB二级全速缓存，双浮点单元和一个3D图形引擎，这些都能大大加强新CPU的功能，因此Cyrix准备把新内核用于1999年低发布的处理器M3(速度可达600~800MHz)，以此来迎击英特尔Katmai、AMD K6-3和IDT Winchip 4。Cyrix CPU一向都以价廉物美著称，而Jalapeno面对仍是主流PC，相信公司会继续走原来的低价格路线，用便宜货来占领市场。

IDT

自Intel宣布不再进行基于Socket7的CPU开发后，这一领域的其他开发商和芯片组、主板生产厂商随即团结起来，推出了Super7体系结构，以最大限度地挖掘此体系架构的潜力。美国IDT公司（Integrated Device Technology）作为新加入此领域的CPU生产厂商，一上来就把着眼点放在了低端市场上。1997年IDT推出的第一个微处理器产品是WinChip（即C6），由于问世较晚且生产规模也不大，因此在整个CPU市场上所占的份额很小，还不足1％。1998年5月，IDE宣布了它的第二代产品WinChip 2 。WinChip2有两种版本，一种带有3DNow！指令集，命名为WinChip 2－3D；另一种不带3DNow！指令集,其命名为WinChip 2，没有后缀3D。WinChip 2在原有WinChip的基础上作了一些改进，增加了一个双指令的MMX单元，增强了浮点运算功能。改进后的WinChip 2比相同频率的WinChip性能提高约10％，基本达到Intel处理器的性能。WinChip 2目前的最高频率CPU为WinChip 300MHz。

99年的第一季度里面，IDT发布了新处理器WinChip 2+NB，CPU内集成了主板北桥芯片，将会加快芯片到内存的存取速度。但此种做法有几个缺点：一是必须购买新主板；二是提高了芯片的面积，只够集成64K全速缓存到CPU中(性能与存取速度为3-1-1-1的256K二级缓存相当)，毕竟，更大的一级缓存肯定比小量L1 cache+大量L2 cache要好。WinChip 2+NB使用0.25微米工艺制造，世片面积约58平方毫米。

至于即将发表的WinChip2的增强形芯片--WinChip3使用新的内核和超级流水线技术，将比WinChip2快两倍，最低频率266MHz，使用0.25微米工艺制造，世片面积约75平方毫米。

还在发展计划之中的WinChip4是真正的第二代Winchip处理器，使用0.25微米工艺制造，世片面积约95平方毫米(如果用0.18微米工艺制造，世片面积只有60平方毫米)，它比153平方毫米的赛扬A(0.25微米工艺)要小得多。拥有128KB一级缓存，芯片频率为400~700MHz，芯片电压为16W(2.5V)或9W(1.8V)。以下是Winchip4的芯片和缓存规格：

1，11进程管道(目前的CPU只有6进程)

2，管道缓冲(读取时间为1个时钟周期)

3，相关的单控制逻辑和数据路径

4，使用动态逻辑芯片

5，6层金属制造

7，指令优化功能，适合高频率芯片而且不会浪费处理器的计算时间

6，2*64KB，2/4路一级缓存

7，2*128，8路一级TLB。

8，缓存可做智能预测、写入分配、合并和动态锁定等工作

IDT为WinChip4提供了发展工具包(PLA发生器，逻辑优化等)，软件商们使用这些程序可以让自己的软件在新处理器上更好地工作。WinChip4使用新式的预测算法，增加分支预测时的成功率。99年底，IDT将把WinChip4推出市场。从技术上来看，WinChip4的竞争对手是英特尔赛扬A，AMD K6-3和Cyrix MII jedi，它们的产品各有特点，很可能会斗得难分难解。

Rise

Rise公司是一家成立于1993年11月的美国公司，主要生产x86兼容的CPU，但在1998年以前很少有人知道它。一年前，该公司如此彻底地改变了它的运作方式，使人不能不注意到它。它开始在媒体上大做广告并发布了许多令人意想不到的内容。坦率地说，Rise公司的行动看起来象是把广告宣传而不是生产硬件当成主业了。在这其间，Rise公司宣称将为笔记本及1000美元以下市场开发基于Socket 7的x86兼容CPU-著名的mP6 CPU。根据Rise公司的说法，不管该CPU的价格怎样，它将与同主频的Intel Pentium II CPU一样快。这是通过使用超流水线的超标量结构技术来实现的，它可以让3条整数指令或3个MMX指令或者2个浮点操作同时进行。这是理论上超过Pentium II最好的方法，因为Pentium II只有两条整数流水线，一个单FPU单元和2个MMX单元。因此，我们认为只有还未面世的AMD公司的K7 CPU才是它唯一有威胁的对手。的确，这一切看起来是很有可能的，特别是当你看到Rise公司熟练的工程师队伍的时候。虽然他们没有生产能力，但他们有80名拥有在如AMD、HP、IBM、LSI、Logic、MIPS、NEC、Sun这样的处理器公司工作经验的工程师。

不过有实力是一回事，所推出的产品如何又是另外一回事了，现在的MP6已经可以在市场上看到，我们可以发现它的确是名不虚传：

mP6不仅价格便宜，而且性能优秀，有着很好的多媒体性能和强大的浮点运算，在98微处理器论坛上他们演示了mP6，它可以很出色地工作在WINDOWS下，并且mP6-266的DVD软解压为28帧/秒，这个数字就连PII300也很难达到，并且它还支持软件调制解调器，利用软件和一些必要的连线就可以上网，些时的CPU占用率只有10%，不仅如此，它还演示了其它多媒体能力和视频会议系统，总之mP6在每个方面都有优秀的表现。MP6每个时钟周期可以同时执行3条X86整数指令，目前只有Intel的Pentium II处理器在执行指令时才能做到。同时mP6每个时钟周期可以同时执行3条MMX指令，目前Pentium II处理器才只能2条。并且MP6通过一个管道浮点单元还能做到同时处理多个浮点运算，这样就大大提升了它的3D处理能力。很可惜mP6为了降低成本所以只有16KB的一级缓存，但还将推出的第二代MP6处理器会有16KB一级缓存和256KB二级缓存。mP6的目标就是笔记本电脑，所以它的耗能很低，其中mP6-233的最大功率是8.2W，要知道K6-2 233MHz是9W，K6-2 266是9.8W，PII 266更高，为19.5W。另外mP6使用了特殊的电路来作芯片的能源管理工作，无须用户干涉，十分适合用作笔记本电脑的CPU。mP6使用Socket 7/Super 7兼容插座，现在正在和ALI合作生产主板芯片组，它可以提供100MHz总线、AGPX2支持、DVD软解压、软件调制解调器、高级电源管理系统，看来RISE的加入，又替风云变换的CPU市场增加了一道风景线。

[page_break]

（出处：http://www.zzzyk.com/）

上一页 [1] [2]

上一个：电脑之“芯”全攻略（五）
下一个：电脑之“芯”全攻略（七）

更多图片编程知识: