这是一份来之不易的情报,由本刊编辑部中的“007”历经千辛万苦获得;这,是一份价值极高的情报,Intel新绝密武器——一第四代酷睿处理器的技术详解、性能全方位测试它都一一包含;这,就是在2013年受DIY玩家期待、为关注的Haswell处理器抢先测试。
我们知道,英特尔的处理器技术发展模式被称为Tick-Tock。Tick-Tock的原意主要是表现吊钟钟摆摆动的声音:“嘀嗒”,一次嘀嗒代表着一秒。而在英特尔的处理器发展战略上,每一次嘀嗒代表着处理器两年里的工艺架构进步。其中在两年中的第一年即“Tick嘀”年中,将推出工艺提升、晶体管变小、架构微调的处理器产品。而在第二年“Tock嗒”年里,英特尔不仅将继续延用上一年带来的新工艺技术,还将推出对处理器微架构进行大幅更新的产品。
因此,在Tick嘀年里的技术更新主要是对工艺进行提升,对处理器架构来说只是小幅改动,不会给性能带来多少提升。而在Tock嗒年中的产品由于架构大幅变动,因此不仅会给处理器的性能、功能带来明显变化,也会决定着处理器在随后的两年中能否在市场上站稳脚步,所以Tock嗒年的发展结果是至关重要的。长期以来,英特尔都遵循这样的模式进行发展,如在20 05年研发出采用65nm工艺的Ce darMill架构的Pentium 4处理器,在2006年便迎来在Intel历史上具有重要意义的Core酷睿架构,并带来了英特尔处理器性能质的飞跃。而即将于2013年6月4日发布的第四代酷睿架构即Haswell处理器也是踩着“嗒”(Tock)字步的全新产品,那么相对于上一代Ivy Bridge处理器,它会有怎样的表现?能否为我们再上演一出性能大幅提升的好戏呢?我们知道,英特尔的处理器技术发展模式被称为Tick-TockTick-Tock的原意主要是表现吊钟钟摆摆动的声音:“嘀嗒”,一次嘀嗒代表着一秒。而在英特尔的处理器发展战略上,每一次嘀嗒代表着处理器两年里的工艺架构进步。其中在两年中的第一年即“Tick嘀”年中,将推出工艺提升、晶体管变小、架构微调的处理器产品。而在第二年“Tock嗒”年里,英特尔不仅将继续延用上一年带来的新工艺技术,还将推出对处理器微架构进行大幅更新的产品。因此,在Tick嘀年里的技术更新主要是对工艺进行提升,对处理器架构来说只是小幅改动,不会给性能带来多少提升。而在Tock嗒年中的产品由于架构大幅变动,因此不仅会给处理器的性能、功能带来明显变化,也会决定着处理器在随后的两年中能否在市场上站稳脚步,所以Tock嗒年的发展结果是至关重要的。长期以来,英特尔都遵循这样的模式进行发展,如在20 05年研发出采用65nm工艺的Ce darMill架构的Pentium 4处理器,在2006年便迎来在Intel历史上具有重要意义的Core酷睿架构,并带来了英特尔处理器性能质的飞跃。而即将于2013年6月4日发布的第四代酷睿架构即Haswell处理器也是踩着“嗒”(Tock)字步的全新产品,那么相对于上一代Ivy Bridge处理器,它会有怎样的表现?能否为我们再上演一出性能大幅提升的好戏呢?
相比Ivy Bridge处理器,Haswell在CPU架构方面改进大的当属加入了有利于多线程执行的TSX扩展,以及大幅度提升运算性能的AVX 2.0、FMA3指令集。除此之外,Haswell在工艺、CPU微架构上也做出了一定的调整。另外,在集成显示核心方面,Haswell的图形性能会有比较明显的增长,EU单元数量会增加,功能上会进一步支持DirectX 11. 1与OpenCL 1.2。在结构和扩展性能方面,Haswell在接口、封装模式上会做出一系列改动,CPU内部将集成电压控制单元,芯片组方面则采用了更新的8系列芯片组。同时,对玩家来说的一个好消息是,Haswell可以实现一定幅度的外频超频。
单单从CPU-Z的侦测规格来看,Haswell架构处理器Core i7 4770K与Core i7 3770K几乎完全相同,配备8MB三级缓存,总计1MB二级缓存,8-way一级缓存,似乎没有什么变化。
从处理器架构对比图上来看,Haswell在细节上仍有非常多的改动。
FIVR可以独立调节每个内核、显卡核心、SA系统助手以及内部的I/O总线等各个部分电路的供电,不需要的部分可以独立关闭,这是降低能耗的关键所在。
AVX 2.0和TSX扩展——重要但暂时用不到的新技术
有关AVX 2.0和TSX扩展的内容,本刊在2012年12月上的《英特尔、AMD下一代处理器架构解析》一文中做出过比较深入和全面的介绍,如果需要详细了解有关这两种技术的读者可以自行查阅。在本文中,我们仅对AVX 2.0和TSX扩展做出概述和结论性的介绍。
TSX扩展主要目的在于改进CPU的多线程应用,它通过引入细粒度多线程和事物型内存的管理方法,能够在支持TSX的应用程序中获得比较明显的多线程性能改善。不过受限于软件支持,短期内TSX可能还不会带来太明显的CPU多线程性能进步。而且根据本文截稿时获得的资料来看,Haswell中的K版产品,即未锁定倍频的处理器不会整合该技术。
AVX 2.0指令集是之前Sandy Bridge和Ivy Bridge上AVX指令集的扩展版本。AVX是高级矢量扩展AdvancedVector Extensions的简写,此指令集的主要用途是加强浮点和整数性能。AVX 2.0主要是将整数部分升级到256bit SIMD阵列,支持FMA3浮点乘积累等新的加速指令。可以预计的是,在短期内这些新的指令集不会有太多软件支持,可能部分测试软件能反映出新版本AVX的优势,但在实际应用上来说的话,需要等待很长一段时间后,软件市场才会出现相关产品。
重点加强多线程性能———Haswell处理器在微架构上的强化
从右边的Haswell与Sandy Bridge架构图对比来看(由于Ivy Bridge属于架构不变、制程升级的Tick阶段,因此本图使用了Sandy Bridge作为Haswell的对比对象),虽然两款处理器的基础架构没有大的改动,但仔细观察后,可以发现Haswell在诸多地方做出了微调,可以在某些应用环境,特别是多线程运算中带来不错的增幅。
Haswell的前端设计和Sandy Bridge基本相同。唯一出现的差别在于Haswell的Decode Queue(解码队列)数量支持56个,而Sandy Bridge为2组、每组28个。这样做的好处是当只有一个线程时,整个56个微指令都可以被更有效的利用,而不像之前的Sandy Bridge那样对单一指令来说,只能使用28个,无论是缓存还是指令排序效率都会更为出色。
在Haswell的调度部分,相比Sandy Bridge做出了很多加强。比如Entry Recorder Buf fer(用于检测能够并行处理的微操作个数),Sandy Bridge数量只有168个,Haswell增加到192个。随之而来的是Haswell的整数寄存器数量有168个(Sandy Bridge只有160个)、AVX寄存器也有168个(Sandy Bridge只有144个)、分支指令寄存器有48个(SandyBridge和Haswell相同)、读寄存器有72个(Sandy Bridge只有64个)、写寄存器有42个(Sandy Bridge只有36个)、统一调度器有60个(Sandy Bridge只有54个)。这部分设计的改善可以提升处理器的并行指令处理能力,加强处理器多线程性能。
这部分是Haswell相比Sandy Bridge变化比较明显的部分。总体来看,Haswell采用了8发射口设计,增加了额外的两个发射口,分别用于Integer ALU & Shift(整数ALU和分支计算)、AGU(写操作地址计算)。此外,Haswell顺应了AVX2.0的需求,将所有有关FMA的操作全部升级到256bit(Sandy Bridge是128bit)。
这部分的升级对Haswell的性能影响更为明显一些。Haswell现在每周期可以进行4个整数微操作,相比上代的3个,这部分性能提升了33%;每周期可以进行2次分支预测,比Sandy Bridge的1次分支预测操作整整提升了100%。在AGU部分,新加入的7号口AGU让Haswell每周期可以进行一个读微操作和两个写微操作。综合来看,这所有的改进和加强让Haswell在多线程操作特别是超线程等应用中有了更为出色的表现,更多的分支预测和更强大的ALU显然能够带来更优秀的性能。
接下来的部分则是Haswell相比Sandy Bridge的缓存改进部分。Haswell的L1缓存带宽由Sandy Bridge的16byte每周期增加到32(存储)~64byte(载入)每周期,L2到L1的缓存带宽也由之前的32byte每周期翻番增加到64byte每周期。虽然无论是L1还是L2都仍采用了8-way的规格设计,但是整个缓存的传输带宽大幅度提升,显然这对于提升Haswell的处理器性能也有一定帮助。
更精准的供电——内置电压控制部分在传统的CPU上,电压控制都是由主板负责的。CPU安装在主板上后,主板会给出诸如核心电压、集成显卡电压、I/O控制单元电压、PLL环状总线电压等。因此,在部分厂商介绍主板时,会出现诸如“主板使用了6+2+1相供电”这样的说明。这种说明标识了供电模块的供给情况,“6+2+1”分别代表CPU核心、集成显卡和I/O以及其他部分供电。不仅如此,传统的CPU超频能力特别是电压调节能力,受到主板品质的影响。主板厂商采用什么类型的PWM,调压芯片是外置还是和PWM一起内置,哪个厂商出品的PWM和调压模块,主板厂商的BIOS能力以及软件能力,都严重影响了CPU在主板上的超频性能。
上述设计和问题在Haswell上将不复存在。原因很简单,Haswell内置FIVR。FIVR即Fully Integrated VoltageRegulator(全集成式电压调节模块)的英文缩写。它将用于实现对Haswell的电压控制和调节。根据资料显示,Haswell中的FIVR模块有20个之多,每一个FIVR模块面积约为2.8平方毫米,每个FIVR模块可以通过25A电流、支持16相供电,理论上多就能控制320相供电,能够为Haswell提供准确的电压控制。在FIVR的控制下,Haswell可以精确调整CPU核心、环状总线、显卡核心以及I/O总线等CPU内部各个部件的电压和功耗情况,既能够保证睿频等功能的正常运行,又能够在部分组件没有任何作用的时候降低电压或者将其关闭节能省电。FIVR是英特尔在Haswell上的又一创新设计,彻底改变了CPU供电设计的状态,为下一步降低CPU功耗,智能控制CPU中每一个部件的性能情况打下了良好的基础。
进一步降低功耗 更成熟的生产工艺
值得注意的是,虽然Haswell的工艺依旧采用22nm 3D晶体管设计,但由于工艺的进步,Haswell的22nm工艺和IvyBridge相比显然要更先进、更成熟一些。英特尔CPU架构设计师就明确地表示:“我们与晶圆制造部门的同事一起做了大量工作以确保更低的功耗,现在我们可以实现高性能与低功耗工艺的完美结合。必须要说明的是,不要认为Haswell的工艺与Ivy Bridge是一样的,工艺可是在不断改进的。”其次Haswell内部架构的一些创新设计可进一步降低功耗,除了FIVR,Haswell还将系统的频率和供电区域进行了细分。在原来的处理器中,环形总线和L3缓存是与处理器核心捆绑在一起进行控制的,而Haswell处理器的内核设计则将核心与L3缓存、环形总线进行了分离。处理器可通过新型的控制单元对缓存与环形总线的频率与电压进行独立控制,根据负载的大小对这两部分的频率与电压进行调节,以实现更好的能耗比。
提升多 Haswell集成显示核心解析英特尔宣称Has we ll的集成显示核心性能有非常大的进步,并根据历年来集成显卡的标称性能制作了一张图表。表中以2006年以来英特尔各款集成显卡在3DMark 06中的性能进步为基准,英特尔认为Haswell中的集成显示核心相比2006年产品的总体性能提升了75倍之多。不管数据是不是真实,英特尔的集成显示核心的性能是实打实的有进步。只不过由于基准性能太低,因此即使两三倍的进步,也一直没有赶上入门级独立显卡的水平。英特尔显示核心存在的问题除了技术和架构设计外,主要还是规模。早期在北桥中集成的显示核心规模不可能大,后来和CPU合二为一后规模也一直受到控制,晶体管数量少再加上本身架构设计不够成熟、驱动表现也不够理想,因此一直都是“功能意义大于性能意义”。
Haswell中的集成显示核心分为GT1、GT2和GT3三个版本,其中GT2的规格是GT1的两倍、GT3则是GT2的两倍。不过GT3仅仅用于移动设备,桌面CPU只能使用GT1和GT2两个版本。和AMD、NVIDIA的独立显卡一样,英特尔的显示核心中也有名称为EU的流处理器簇(AMD功能相近的单元称为GCN单元,NVIDIA功能相近的单元称为SMX)。根据之前的资料,英特尔的每个EU单元有4个ALU。GT1有10个EU单元,总计40个ALU,1个曲面细分单元。GT2则拥有20个EU单元,80个ALU和2个曲面细分单元,GT3则直接翻倍到40个EU单元、160个ALU单元和4个曲面细分单元(曲面细分单元可能并未配置如此之多,因为本身集成显卡的性能也不需要配置如此“强大”的曲面细分单元)。此外,以上三种集成显示核心还支持DirectX 11.1、OpenCL 1.2通用加速运算等新技术标准。
目前GT3只会使用在顶级的移动版本中,为了解决移动显卡的带宽问题,英特尔会为GT3版本的产品配备昂贵的512bit、128MB的eDRAM缓存用作显存,带宽估计64GB/s 。这部分eDRAM将占用70平方毫米~80平方毫米的面积,大约是Haswell 210平方毫米~240平方毫米核心面积的1/3~1/4,面积不可谓不大—当然价格也不菲,使用eDRAM的型号英特尔要额外加收多达50美元(约合360人民币)左右的费用。部分未经证实的消息称这部分集成的eDRAM也可以作为L4缓存使用,不过目前看起来可能性不大。
在GT3大幅度提高规格、使用eDRAM这种昂贵的缓存后,英特尔宣称GT3高性能相比在Ivy Bridge中使用的HD 4000系列提升了接近3倍之多。如果真的有这么大的性能提升幅度,那么英特尔宣称自己的集成显卡超越诸如GeForceGT 640M之类的独立显卡也不是没有希望,不过代价也比较昂贵,除了额外增加的50美金外,TDP也上升了不少。看来性能和功耗果然不可兼得,即使是英特尔……
英特尔宣称,与早期产品相比,Haswell上的集成显示核心性能提升了75倍之多。
如图所示,Haswell处理器(左)的正面与Ivy Bridge(右)相比并无明显不同,但背面的区别很大。它的触点排布方式发生了大幅变化,总计少了5个触点,防呆口位置也设计得更高(如红框处),另外H a s we l l背面中间的陶瓷电容元件数量也少了很多。
既然集成显卡的性能大幅度提升了,继续叫做HD系列显卡就不太恰当了。英特尔为Haswell上的高性能集成显示核心起了新名字,叫做Iris,中文名为“锐炬”。目前分为Iris和IrisPro两个版本,全称是“英特尔锐炬显示芯片”和“英特尔锐炬Pro显示芯片”两种。而桌面版本的集成显示核心则延续使用HD Graphics这一前缀,即人们常说的“核芯显卡”。目前已知的Haswell集成显卡型号从高到低分别为:
GT3带eDRAM版本,TDP未知,称为Iris Pro Graphics 5200;
GT3版本,TDP28W,称为Iris Graphics 5100;
GT3版本,TDP15W,称为Iris Graphics 5000;
GT2版本,TDP未知,称为HD 4600/4400/4200;
GT1版本,TDP未知,称为HD Graphics
总的来看,英特尔对自己GPU性能的提升还是很满意的,不但大幅度加强了硬件规格、引入了eDRAM,还改了名字。虽然英特尔目前在CPU和G PU的占有率上都是全球第一并且全部超过了60%,但是高性能GPU一直是英特尔的痛处,希望英特尔这次不再让人们失望吧。
可调节更多频率 Haswell在超频上的改进
英特尔在Haswell的频率控制部分做了很多改进,在以往的K版处理器中,处理器倍频大只能提升到×63(Ivy Bridge)和×57(Sandy Bridge)。而在Haswell上,倍频上限被进一步提升到×80——这也就意味着BCLK频率在100MHz的情况下,Haswell的高理论频率可以达到8GHz,大大超出了之前6.3GHz左右的水平。同时,Intel还取消了Haswell集成显示核心部分的频率限制,其倍频高可以调节到×60即3GHz。此外,Haswell提高了内存倍频调节范围,在外频100MHz的基础上,内存频率可以调节到高DDR3 3200。
Haswell变化大的是,采用了和之前Sandy Bridge-E平台上类似的RCR(Reference Clock Ratio参考时钟比率)技术,额外增加了125MHz和167MHz两个外频设定点,频率的上下实用浮动范围是5%~7%(比如100MHz的标准频率,可以在93MHz~107MHz之间浮动。对于167MHz的外频来说,可以在155MHz~179MHz之间浮动),高上限可以达到200MHz。虽然对超频玩家来说,传统以“1MHz”为单位的超外频再也不会回来了,但至少Haswell可以再次通过大幅调节外频与倍频,两者相结合的方式来提升频率,为超频玩家带来更多玩法。不过需要注意的是,只有K版即可调节倍频的Haswell处理器支持外频调节,普通版本的产品仍只能使用100MHz外频。
首批产品面向中高端 Haswell处理器一览
Haswell处理器的桌面平台使用了新的Socket H3接口,针脚数量更改为1150个,支持35W~95W的散热解决方案。移动平台分为两部分,第一部分是Socket G3插槽,947针脚,依旧是双芯片封装,TDP范围是37W~47W之间,嵌入式产品会降低到15W;第二部分则是全新的单芯片SOC接口,TDP降低到15W。第二种SOC类型的单芯片封装是专门为超极本和一些对面积要求很严格的产品而设计的,因此玩家可能会看到基于Haswell的体积更小、更轻薄的移动设备上市。
根据英特尔的资料来看,首批上市的Haswell新品主要还是集中在Core i7和Core i5上,至于广大玩家喜闻乐见的Core i3和Pentium等中低端级别产品,则暂时没有消息。根据惯例,至少得在Haswell发布第二个甚至第三个季度后,才能看到它们的身影了。
RCR技术出现的主要目的在于放宽Sandy Bridge、Ivy Bridge上出现的BCLK外频频率和PC I-E总线、SATA总线以及USB总线频率之间的锁定情况。在Sandy Bridge和Ivy Bridge上,由于整个系统的时钟发生器被集成到了CPU内部,因此一旦改变BCLK外频频率的话,SATA、USB等设备由于无法工作在高频率下,只能令系统“罢工”导致超频失败。RCR出现后,增加了几个频率设定点,比如125MHz和166MHz,选择这些设定点后,虽然BCLK提升不少,但是SATA、USB、PCI - E等设备的频率不会随之提升,依旧工作在比较安全的范围内。
首先了解相对于Ivy Bridge架构,Haswell处理器性能的提升幅度。其次测试更成熟的3D晶体管、22nm生产工艺,以及新型电源管理技术对于减少处理器功耗、提升处理器的超频能力是否有明显帮助,Haswell处理器是否改善了IvyBridge处理器热密度高、发热量大的问题。后测试Haswell台式机处理器整合的HD Graphics4600核芯显卡性能,是否如英特尔宣传那样得到了大幅提升,这代处理器是否真的有资格定级为Tock。
出各款处理器的性能,我们在测试时采用了DDR 32133内存,并将内存频率、延迟统一设置为DDR 32133@9-11-11-30-1T。
在此次Haswell处理器测试中,我们仍延续了传统的测试方法,如在性能测试中,我们首先使用SiSfotware Sandra、CINEBENCH R11.5、Super Pi等软件测试处理器的理论性能,通过视频转码、PhotoShop图片处理、3dsMax图形渲染、Excel等应用软件体验处理器的实际性能,接下来通过运行多款3D游戏大作测试处理器的游戏性能,后则使用OCCT处理器拷机测试,了解处理器满载时带来的系统功耗。
在本次测试中,我们将对Haswell处理器中的顶级产品Core i7 4770K进行详细测试。当然,单单依靠对一款处理器的测试,并不能了解它到底具备怎样的水平,因此我们还将在性能测试中全程使用Core i7 3770K、Corei7 3960X这两款处理器与其进行对比测试,通过这样的测试,一来可以了解Haswell相对于Ivy Bridge处理器的提升幅度;二来也可以比较目前新的主流级Core i7处理器,相对于由Core i7 3960X与X79组成的顶级平台还有多大的差距。同时,在为重要的处理器性能测试中,我们还会加入英特尔Core i7 2600K、Xeon E3-1230V2、Xeon E3-1230等多款Ivy Bridge、Sandy Bridge架构的处理器产品,让您更直观地了解Haswell处理器的进步与不足。
同时,由于本次测试中所用Haswell处理器、Z87主板均为工程样品,有时可能会出现频率无法达到标称规格的情况。因此在测试中,我们还增加了一个有趣的项目,将Core i7 4770K、Core i7 3770K均锁定为3.5GHz,关闭睿频加速功能,进行同频性能对比,这样就可以更精准地比较出Haswell架构处理器相对于Ivy Bridge架构的优势。
此外,鉴于Haswell处理器采用了更为成熟的22nm工艺技术,因此我们还会为发烧友进行他们关心的水冷超频测试。不过测试中除了简单的性能测试外,我们更会着重考察加压超频后,Haswell处理器的发热量与温度表现,Ivy Bridge带来的高热密度问题在Haswell上是否得到解决。
而为了了解Haswell处理器中的另一个升级重点——HD Graphics4600核芯显卡的性能水准,我们将采用Intel HD Graphics 4000核芯显卡。拥有当今一流整合3D性能的AMD A10-5800K APU、以及一块Radeon HD 6570 低端独立显卡与其进行对比测试。测试内容不仅有常见的3D游戏性能测试,还包括了视频编码、Photo Shop特效处理、musemage图像处理等日常应用测试。
理论性能提升明显 处理器性能测试
在理论性能测试中,Haswell处理器首先呈现给我们的就是在SiSoft ware Sandra的处理器算术性能测试,以及多媒体性能测试中,Core i74770K都以较为明显的优势领先其他对手。其重要的原因就在于它对AVX 2.0指令集、FMA3指令集提供了支持。从测试子项目可以看到,AVX 2.0指令集大幅提升了Haswell处理器的整数运算性能,其多媒体整数性能达到383.44MPixel/s,而Core i7 3770K的多媒体整数性能仅有270MPixel/s,领先幅度达42%;其多媒体浮点性能则在FMA3指令集的帮助下提升到371.44MPixel/s,较Core i7 3770K也有17%的领先。后的综合测试评估显示,Core i7 4770K的多媒体处理器性能已超越顶级产品Core i7 3960X,位居首位。当然,需要注意的是,要想发挥出Haswell如此巨大的运算性能,需要软件对AVX 2.0、FMA3等指令集也提供优化与支持。
另一个值得注意的结果在于,Core i7 4770K处理器在缓存与内存带宽测试项目中有明显的提升,特别是在测试子项大。目中,一级数据缓存带宽相对于Core i73770K有72%的巨大提升。显然这得益于Haswell架构加倍了一级数据缓存的每周期读写能力,并增加了二级缓存TLB单元的共享缓存。
而在其他基于应用、科学运算的常用性能测试中,不论是面对Ivy Bridge还是Sandy Bridge,Core i7 4770K的领先幅度都不是特别大。唯一的例外是,在CINEBENCHR11.5这种可调用所有线程的多线程运算软件中,Core i7 4770K较Core i7 3770K有7.3%的领先。原因很简单,绝大部分软件并没有对AVX 2.0与FAM3进行过优化,因此在这样的测试与应用中,Has well只能依靠像8发射口设计、改善的缓存与超线程运行能力,以及更强的并行指令执行能力等等这些着重提升多线程性能的微架构改进来获得性能进步。此外值得注意的是,在反映处理器单核性能的Super Pi测试中,Core i7 4770K是当中完成运算速度快、耗时少的产品。这显示出,在经过几代的进化后,主流酷睿处理器的单核性能已有不小的进步,在面对以Sandy Bridge-E这类老核心打造的顶级处理器时,具备一定优势。
需要说明的是,可能由于所用处理器与主板是工程样品的缘故,在内存带宽测试、处理器加密性能测试中,Core i74770K还出现了原因不明的大幅下降,落后于不少对比产品,我们将在后续获得正式版产品后,再做验证。
多线程性能提升显著 处理器应用性能测试
从表2可以看到,由于当前大部分应用软件并未对AVX 2.0、FMA3新指令集提供支持,因此在大部分测试中,其结果与Super Pi、wPrime测试类似,Core i7 4770K仅以较小的优势领先Corei7 3770K。而在占用线程数较少,往往只使用1~6个线程的Media Converter转码、Photoshop图片处理等应用中,两款主流级Core i7处理器还凭借单核心性能更强的优势 ,在测试中战胜Core i7 3960X。
整个测试中,大的亮点在于Core i7 4770K的3ds Max 2012玻璃马渲染时间居然比Core i7 3770 K减少了足足50秒。在这个应用中,Core i7 4770K相对Core i7 3770K具备极大的优势。我们知道这两款处理器具备几乎完全相同的基本频率与睿频频率,而3ds Max 2012渲染又是一个可以100%调用处理器所有线程、令处理器处于满负荷状态下的高强度应用。因此出现这样的测试结果只能说明,Core i7 4770K处理器的架构设计具备优势,这进一步证明Haswell处理器微架构主要改善了多线程性能,处理器的超线程工作效率大大提升。
变化不大 处理器游戏性能测试
从表3来看,由于决定游戏性能的主要因素在于显卡,因此在将Core i7 3770K处理器升级为Core i74770K后,Haswell平台的游戏性能也没有得到明显增加,两个平台的游戏平均运行帧速几乎在1fps之内。因此,对于主要以游戏应用为主的玩家来说,如果已经购买了Core i7 3770K、Core i7 3770等高端产品,那么就没有升级Haswell的必要。
游戏体验中,我们还发现了一个值得关注的现象,即便是《孤岛危机3》、《战地3》这些使用各种高新技术的重量级3D游戏,往往多也只会调用6个线程。因此凭借更强的单核性能、更高的工作频率,Core i7 4770K、Core i7 3770K这些核心数不多的主流级产品,反而拥有更好的处理器游戏性能,而Core i7 3960X这样的6核心顶级产品却在不少游戏测试中大幅落败。所以就目前游戏发展现状来看,四核心的Core i7处理器就能完全满足游戏玩家对性能的需求。
差距仍在多线程性能 3.5GHz同频性能对比测试
从关闭睿频功能、将频率锁定在3.5GHz下的同频测试中(表1),可以看到,在保持频率完全一致的情况下,Haswell核心在这几个性能测试中,仍能全面领先于Ivy Bridge核心,但领先幅度则有高有低。在反映处理器单核性能的Super Pi一百万位测试中,Core i74770 K只比Core i7 3770 K缩短了不到0.2s,性能领先幅度仅1.6%。而在可以调动所有处理器运算线程的CINEBENCHR 11. 5渲染性能测试里,运算性能则提升了8.2 % 。所以,该测试不仅显示出Haswell核心具备更高的运算性能,更再次证明在多核心、多线程应用中,Haswell处理器的优势才能得到明显体现。
提升显著 HD Graphics 4600测试
架构的改进、执行单元数量的增加的确给HD Graphics 4600带来了令人满意的测试结果。在3D游戏性能测试中,它的测试结果不仅明显超过了其上一代顶级核芯显卡HD Graphics 4000,更拥有非常接近AMD强集成显卡Radeon HD 7660D(集成在AMDA10系列APU中)的实力,其性能大致相当于450元级Radeon HD 6570独立显卡的80%~86%。虽然对于购买Core i5、Core i7的大部分台式机用户来说,更倾向于选择独立显卡,很难有机会使用属于GT2版本的HD Graphics 4600核芯显卡。但HD Graphics 4600核芯显卡在3D性能方面的优秀表现,则意味着技术规格翻倍的GT3系列显示核心,将很可能具备超越不少独立显卡的性能。因此在移动运算领域,英特尔集成显卡将大显身手,具备夺占更大市场份额的潜力。
同时,得益于对OpenCL1.2技术规范的支持,在Photoshop CS6两种滤镜效果处理中,HD Graphics4600也表现出了更好的通用运算加速性能,所用时间短。而其Quick Sync Video技术也发挥出一贯的威力,在转码测试中拔得头筹。稍有不足的是,可能由于对软件支持度不佳的缘故,在musemage图形处理性能测试中,两款核芯显卡的通用运算能力并未得到发挥,表现位居末位。
功耗优势明显 功耗与温度测试测试点评:从表4可以看到,更成熟的22nm 3D晶体管生产工艺,Haswe ll核心与L 3缓存、环形总线的供电分离设计,以及集成电压调节器对各个电压区域更精确的控制令处理器功耗得到了明显降低。在待机状态下,Haswell平台的系统功耗比Ivy Brige平台有6W的降低,而在满载状态下的效果则更加明显。运行CPU OCCT拷机测试时,Haswell平台的系统功耗比Ivy Brige平台少了足足25W。毫无疑问,更高的能耗比也是英特尔敢将Haswell定级为“Tock”的原因之一。
不过在发热量控制上,Haswell架构显然没有得到明显改善。在使用海盗船H100水冷散热器,运行CPU OCCT拷机测试10分钟时,处理器四颗核心中的工作温度均突破60℃。我们分析,原因在于Haswell处理器晶体管数量相对于Ivy Bridge并未得到降低,而且内部还新增了FIVR电压调节器及配套元器件,这也预示着Haswell的超频性能可能并不会令人太满意。
延续高热密度 Haswell超频测试
从方法上来看,由于英特尔在Haswell上引入了RCR技术,解除了外频锁定状态,增加了125MHz和167MHz两个设定点,因此对Corei 74770K的超频设置非常简单。测试中,我们只是将处理器核心电压上调到1.3V、外频上调到127MHz,倍频小幅增加到×37,处理器频率即提升到4.7GHz左右,并可完成CINEBENCH R11.5、wPrime32M等多个测试,成绩已接近Core i7 3960X,具备较高的稳定性。
那么能否继续增加Core i7 4770K的频率,在更高的频率下稳定使用呢?答案是很难,因为处理器在4.7GHz下就已经很热了。通过OCCT监控软件,可以看到,在运行CINEBENCH R11. 5这不到3分钟的运算过程中,加压超频后的处理器温度上升显著,其中三颗核心的温度均已突破90℃。因此由Ivy Bridge带来的热密度高的问题并未在Hawell上得到解决,甚至因为FIVR电压调节器集成的缘故有愈演愈烈的趋势。所以就普通散热条件下的超频能力来看,Haswell处理器核心没有进步。如超频后想长期使用,玩家好将频率控制在4.5GHz以内,电压降低到1.25V以内。
得失兼具合格的“Tock”年产物
用“得失兼具”来形容Haswell在此次测试中的表现,我们认为是再合适不过的词语。一方面这款贴有“TOCK”标签的新一代处理器的确在不少测试中带来了性能大幅增长,在支持AVX2.0、FMA3 指令集的测试中,它相对于Ivy Bridge处理器有高突破40%的性能提升幅度。而微架构的改进,也为其多线程性能带来了明显的进步——一帧画面的3ds Max渲染时间就能缩短50s,这对于高端商业用户、发烧友显然具备极高的吸引力。HD Grapchics 4600核芯显卡的卓越表现,也令英特尔台式机平台的整合图形性能第一次具备非常接近竞争对手的实力。因此对于一款“Tock ”年产物,Haswell的表现是合格的。
然而,由Ivy Bridge带来的热密度高、发热量高问题在Haswell上并未得到改善。此外,尽管它在一些测试中的表现非常优秀,但要么需要软件支持AVX2.0、FMA3等新一代指令集,要么需要像3ds MAX这样,具备可以调动所有线程的能力,但这样的软件在消费级领域并不普遍,因此要体验Haswell的性能潜力还需要一定的时间。不过需再次强调的是,本次测试中所用CPU、主板均为工程版产品,并不一定能100%地准确反映Haswell平台的完全性能,正式版产品是否会有更好的表现呢?请关注MC评测室后续为您带来的更多精彩报道。
在使用水冷散热器的情况下,运行10分钟CPU OCCT拷机测试后,处理器四颗核心的温度也均突破了60℃。