MCPLive > 杂志文章 > 高频八核怪兽的逆袭

高频八核怪兽的逆袭

2012-11-06《微型计算机》测评室《微型计算机》2012年11月上

8颗核心同时工作在4GHz!如果你在2004年对Intel当时的CEO贝瑞特讲出这样一句话,我相信他肯定会目瞪口呆。还记得吗?就是在那年秋天,贝瑞特不得不为奔腾4处理器无法突破4GHz大关而下跪道歉。而在8年后的今天,摩尔定律早已发挥出它应有的作用。4GHz不仅已成为一些中低端处理器的默认设置频率,更出现在了这款核心数多达8颗、由AMD新推出的FX 8350旗舰级产品上。超高的工作频率、无出其右的核心数量令FX 8350成为消费级处理器中的“怪兽”,而它的价格却仅仅只与竞争对手的中端产品相当。那么,这头“怪兽”的出现是否预示着中端处理器市场格局将被重新改写?是否意味着高频等于高能,多核等于高效?

高频八核怪兽的逆袭

2011年,凭借4模块8核心设计、4指令并发发射机制、CMT多簇式多线程等多种新技术的应用,采用“推土机”微架构设计的FX系列产品将AMD处理器性能带上了一个全新的高度。而在2012年,为了在市场上抢占先机、应对竞争对手新产品的挑战,AMD对“推土机”微架构进行了改进、升级,其成果就是现在广为人知的“打桩机”微架构。与被FX系列处理器独占的“推土机”微架构不同,“打桩机”微架构将成为AMD在接下来一年的主力军,从面向主流消费者的AMD新一代APU——Trinity,到为性能玩家设计的新一代FX处理器都将使用这种新架构。

在本刊2012年10月下的《AMD新一代台式机APU完全测试》文中,我们已经对Trinity的处理器与图形核心性能进行过详细测试。不过由于Trinity定位主流,主要针对使用集显核心的普通用户,其处理器核心在技术规格上也有所削减,并不能为玩家提供代表AMD高水平的处理器性能。如果你是一位追求性能的玩家,如果你想组建高性能的独显平台,那么就请随我们一起走进新一代FX系列处理器的神秘世界。

代表AMD高水准 FX处理器技术简析

其实在Trinity的测试中,我们已经对打桩机核心技术架构进行过详细解析。总体来看打桩机架构和推土机架构基本上是完全相同的,如它的内部也采用模块化设计,每个模块拥有两个整数核心以及一个共享的浮点运算单元。同时,得益于CMT多簇式多线程技术的采用,模块内部的两个整数单元和浮点单元是高度共享的,这些运算单元紧密地联系在一起,动态共享部分资源并协同处理两个线程。每一个模块都具备将一个大任务细分为多个并行任务的能力,这些线程处理方式可以按需要任意整合,不会对整个流水线的效能造成影响。因此在CMT技术的帮助下,打桩机架构也将拥有高于传统SMT多线程解决方案的性能表现。

相对推土机架构来说,打桩机只是一个小幅进化,通过部分内部结构的微调等,带来性能功耗比的提升,简单总结来说主要有以下几点:

1.改进分支预测系统,增加指令窗口大小,提高处理器的IPC即每时钟周期指令执行数;

2. 加入了对FMA3(用于乘加计算,原英特尔处理器AVX指令集的子集)、F16C指令集(16bit的浮点转换指令)的支持,并加快指令的执行速度,令处理器的性能与兼容性都有了进一步提升;

3.通过改进存储—读取的排队序列,增加TLB转移指令缓冲区通道数,缩短缓存读取延迟,以及增强硬件预取功能,提升了打桩机核心的缓存性能。同时,内存控制器对DDR3 1866内存的完善支持,令它的内存性能得到保证;

4.改进处理器的浮点与整数单元调度器,每个整数核心拥有40入口的调度器,而共享的浮点核心则拥有60入口调度器,可提升任务分解、分配能力,以及计算单元的运行效率;

5.这是为重要的,它采用了更加成熟的32nm工艺制造,并在谐振时钟网络技术的帮助下,令处理器的漏电率、发热量得到减小,并大幅提升了处理器可稳定工作的高频率。

如图所示,打桩机微架构主要增加了对新指令集的支持,并对分支预测系统、缓存存储单元、浮点与整数单元调度器等方面进行了改进。
如图所示,打桩机微架构主要增加了对新指令集的支持,并对分支预测系统、缓存存储单元、浮点与整数单元调度器等方面进行了改进。

而与Trinity APU的CPU核心相比,新一代FX系列处理器大的不同是拥有更大的缓存容量。它不仅为每个模块即每两个核心提供了一个可供它们独立使用的2MB二级缓存,还配备一个可供所有模块共同使用、容量达4MB~8MB的三级缓存。同时,由于定位更高,FX系列处理器还拥有更多的核心数量。因此,虽然同样都采用了打桩机核心,但新一代FX系列处理器相比新一代台式机APU具备更强的处理器性能。

打桩机核心FX处理器架构示意图(上图),内部集成晶体管数量高达12亿个,核心面积为315mm2。与Trinity的处理器核心(下图)相比,它大的不同是增加了4MB~8MB三级缓存,去掉了集成GPU。

打桩机核心FX处理器架构示意图(上图),内部集成晶体管数量高达12亿个,核心面积为315mm2。与Trinity的处理器核心(下图)相比,它大的不同是增加了4MB~8MB三级缓存,去掉了集成GPU。
打桩机核心FX处理器架构示意图(上图),内部集成晶体管数量高达12亿个,核心面积为315mm2。与Trinity的处理器核心(下图)相比,它大的不同是增加了4MB~8MB三级缓存,去掉了集成GPU。

新一代FX处理器仍采用Socket AM3+接口,从外观来看,FX 8350(左)与FX 8150处理器(右)并无明显不同,9系列芯片组仍是它的佳搭配平台。

新一代FX处理器仍采用Socket AM3+接口,从外观来看,FX 8350(左)与FX 8150处理器(右)并无明显不同,9系列芯片组仍是它的佳搭配平台。
新一代FX处理器仍采用Socket AM3+接口,从外观来看,FX 8350(左)与FX 8150处理器(右)并无明显不同,9系列芯片组仍是它的佳搭配平台。

如本页下方的表格所示,目前AMD共推出了四款采用打桩机核心制造的新一代FX系列处理器,从采用4核心设计的FX 4300,到6核心FX 6300,再到8核心FX 8350,可以满足不同预算、不同需求的用户。其中耀眼的,毫无疑问就是位于位于塔尖的FX 8350。虽然其默认4GHz工作频率与FX 4170相比要略低一点,但它的核心数量却是FX 4170的一倍,多达8颗,8颗核心同时工作在4GHz,这是怎样的一种刺激呢?而更“要命”的是,根据国外媒体的透露,这头高频8核“怪兽”的价格却并不惊人,预售价格在253美元左右,折合人民币仅1583元。这也就意味着它在国内的预售价格很可能只会和英特尔的Core i5 3570K这类四核中端产品相当。强悍的技术规格、适中的价格,是否意味着这头“怪兽”将成为中端用户群值得考虑的选择呢?

FX 8350处理器拥有极高的工作频率,通过智能超频3.0技术的帮助,其8核心工作频率可自动超频到4.1GHz ~4.2GHz使用。
FX 8350处理器拥有极高的工作频率,通过智能超频3.0技术的帮助,其8核心工作频率可自动超频到4.1GHz ~4.2GHz使用。

全面+专业 我们怎样测试

测试平台
处理器 AMD FX 8350、AMD FX 8150、英特尔Core i5 3570K
主板 技嘉GA-990FXA-UD7
显卡 RADEON HD 7970
内存 博帝DDR3 2400 4GB×2
硬盘 OCZ Vertex4 256GB
电源 X7-1200
操作系统 Windows7 Ultimate 64bit

测试目的:主要了解相对于采用推土机微架构的处理器,新一代FX处理器的性能提升幅度,以及在实际应用、游戏中,它是否能为用户带来更好的体验。其次测试更加成熟的32nm工艺、谐振时钟网络技术对于减少处理器功耗、提升处理器的超频能力是否有明显帮助。同时,通过与相近价位英特尔Ivy Bridge Core i5处理器的对比,了解FX 8350处理器是否具备改写中端处理器市场格局的实力。

测试方法:首先我们将通过SiSoftware Sandra、CINEBENCHR11.5、wPrime、Super Pi等基准性能测试软件,以及3ds MAX 2012、Photoshop CS6、Excel 2010、WinRAR 4.2、《尘埃:决战》、《幽灵行动:未来战士》、Prime95等应用软件与游戏,测试新一代FX处理器的处理器性能、内存与缓存性能、应用体验水准、功耗。由于本次进行评测的是定位高FX 8350,因此我们还将采用推土机架构处理器中的顶级产品—FX 8150与其进行对比测试,了解打桩机微架构处理器的性能提升幅度。需要说明的是,在与FX 8150的对比中,我们除了在它们的默认频率设置下进行对比外,还会将两颗处理器的频率手动设置为一致,进行单独的同频性能测试。通过该测试,我们就能准确地知道在完全相同的工作环境下,打桩机核心内部架构的改进幅度。

AMD FX系列处理器规格

同时,针对FX 8350处理器定价不高的特点,我们还会采用价格与其相近的英特尔Core i5 3570K处理器进行对比测试。通过它们的对比结果,我们就能了解新一代FX系列处理器是否会给中端处理器市场带来冲击,改变格局。

后,鉴于FX 8350采用更加成熟的32nm工艺,并使用了谐振时钟网络技术,我们还将对FX 8350处理器的超频性能进行详细测试。测试中,我们除了使用传统的风冷超频外,还将通过液氮制冷,对处理器进行极限超频。

提升显著 处理器理论性能测试

测试点评:从测试结果的对比来看,FX 8350的成绩符合期望,在大部分测试中都取得了领先。如在对多线程支持非常不错的SiSoftware Sandra处理器整体性能测试中,相对于FX 8150,FX 8350的测试成绩领先幅度高达11.3%。同时,在多媒体处理性能测试中,FX8350的多媒体整数性能达到206.29MPixel/s。这不仅明显超过FX 8150处理器186.81MPixel/s的处理能力,更大幅度领先与其对比的Core i53570K。

而在浮点性能测试上也不例外,尽管每个模块只有一个共享的浮点单元,FX 系列8核心处理器看似只有4个浮点运算单元,但每个浮点单元内可配备了两个128bit FMAC单元。而这两个运算单元的工作方式非常灵活,既可以根据需要被每个核心单独使用,也可以合并组成一个256位FMAC单元使用,同样具备不可小觑的性能.同时再加上超高工作频率的助力,FX 8350在大部分浮点运算测试中也轻松超过FX 8150与Core i5 3570K。

不过,FX 8350的不足也非常明显,AMD单个浮点运算单元效率不足的缺点在FX 8350上依然得到了继承。无论是在Super Pi一百万位运算,还是在CINEBENCH R11.5单核心渲染这些单线程性能测试中,FX 8350与Core i5 3570K相比都有明显差距。而且比较奇怪的是,经我们多次测试,在Super Pi测试中,FX 8350的耗时略多于FX 8150,未能体现出其高频优势。同时,尽管从推土机架构开始,AMD处理器就对AES指令集提供了支持,但从加密解密性能测试成绩来看,其支持度与英特尔产品相比仍有所不足。

处理器理论性能测试

处理器理论性能测试

分享到:

用户评论

用户名:

密码: