8颗核心同时工作在4GHz!如果你在2004年对Intel当时的CEO贝瑞特讲出这样一句话,我相信他肯定会目瞪口呆。还记得吗?就是在那年秋天,贝瑞特不得不为奔腾4处理器无法突破4GHz大关而下跪道歉。而在8年后的今天,摩尔定律早已发挥出它应有的作用。4GHz不仅已成为一些中低端处理器的默认设置频率,更出现在了这款核心数多达8颗、由AMD新推出的FX 8350旗舰级产品上。超高的工作频率、无出其右的核心数量令FX 8350成为消费级处理器中的“怪兽”,而它的价格却仅仅只与竞争对手的中端产品相当。那么,这头“怪兽”的出现是否预示着中端处理器市场格局将被重新改写?是否意味着高频等于高能,多核等于高效?
2011年,凭借4模块8核心设计、4指令并发发射机制、CMT多簇式多线程等多种新技术的应用,采用“推土机”微架构设计的FX系列产品将AMD处理器性能带上了一个全新的高度。而在2012年,为了在市场上抢占先机、应对竞争对手新产品的挑战,AMD对“推土机”微架构进行了改进、升级,其成果就是现在广为人知的“打桩机”微架构。与被FX系列处理器独占的“推土机”微架构不同,“打桩机”微架构将成为AMD在接下来一年的主力军,从面向主流消费者的AMD新一代APU——Trinity,到为性能玩家设计的新一代FX处理器都将使用这种新架构。
在本刊2012年10月下的《AMD新一代台式机APU完全测试》文中,我们已经对Trinity的处理器与图形核心性能进行过详细测试。不过由于Trinity定位主流,主要针对使用集显核心的普通用户,其处理器核心在技术规格上也有所削减,并不能为玩家提供代表AMD高水平的处理器性能。如果你是一位追求性能的玩家,如果你想组建高性能的独显平台,那么就请随我们一起走进新一代FX系列处理器的神秘世界。
其实在Trinity的测试中,我们已经对打桩机核心技术架构进行过详细解析。总体来看打桩机架构和推土机架构基本上是完全相同的,如它的内部也采用模块化设计,每个模块拥有两个整数核心以及一个共享的浮点运算单元。同时,得益于CMT多簇式多线程技术的采用,模块内部的两个整数单元和浮点单元是高度共享的,这些运算单元紧密地联系在一起,动态共享部分资源并协同处理两个线程。每一个模块都具备将一个大任务细分为多个并行任务的能力,这些线程处理方式可以按需要任意整合,不会对整个流水线的效能造成影响。因此在CMT技术的帮助下,打桩机架构也将拥有高于传统SMT多线程解决方案的性能表现。
相对推土机架构来说,打桩机只是一个小幅进化,通过部分内部结构的微调等,带来性能功耗比的提升,简单总结来说主要有以下几点:
1.改进分支预测系统,增加指令窗口大小,提高处理器的IPC即每时钟周期指令执行数;
2. 加入了对FMA3(用于乘加计算,原英特尔处理器AVX指令集的子集)、F16C指令集(16bit的浮点转换指令)的支持,并加快指令的执行速度,令处理器的性能与兼容性都有了进一步提升;
3.通过改进存储—读取的排队序列,增加TLB转移指令缓冲区通道数,缩短缓存读取延迟,以及增强硬件预取功能,提升了打桩机核心的缓存性能。同时,内存控制器对DDR3 1866内存的完善支持,令它的内存性能得到保证;
4.改进处理器的浮点与整数单元调度器,每个整数核心拥有40入口的调度器,而共享的浮点核心则拥有60入口调度器,可提升任务分解、分配能力,以及计算单元的运行效率;
5.这是为重要的,它采用了更加成熟的32nm工艺制造,并在谐振时钟网络技术的帮助下,令处理器的漏电率、发热量得到减小,并大幅提升了处理器可稳定工作的高频率。
如图所示,打桩机微架构主要增加了对新指令集的支持,并对分支预测系统、缓存存储单元、浮点与整数单元调度器等方面进行了改进。
而与Trinity APU的CPU核心相比,新一代FX系列处理器大的不同是拥有更大的缓存容量。它不仅为每个模块即每两个核心提供了一个可供它们独立使用的2MB二级缓存,还配备一个可供所有模块共同使用、容量达4MB~8MB的三级缓存。同时,由于定位更高,FX系列处理器还拥有更多的核心数量。因此,虽然同样都采用了打桩机核心,但新一代FX系列处理器相比新一代台式机APU具备更强的处理器性能。
打桩机核心FX处理器架构示意图(上图),内部集成晶体管数量高达12亿个,核心面积为315mm2。与Trinity的处理器核心(下图)相比,它大的不同是增加了4MB~8MB三级缓存,去掉了集成GPU。
新一代FX处理器仍采用Socket AM3+接口,从外观来看,FX 8350(左)与FX 8150处理器(右)并无明显不同,9系列芯片组仍是它的佳搭配平台。
如本页下方的表格所示,目前AMD共推出了四款采用打桩机核心制造的新一代FX系列处理器,从采用4核心设计的FX 4300,到6核心FX 6300,再到8核心FX 8350,可以满足不同预算、不同需求的用户。其中耀眼的,毫无疑问就是位于位于塔尖的FX 8350。虽然其默认4GHz工作频率与FX 4170相比要略低一点,但它的核心数量却是FX 4170的一倍,多达8颗,8颗核心同时工作在4GHz,这是怎样的一种刺激呢?而更“要命”的是,根据国外媒体的透露,这头高频8核“怪兽”的价格却并不惊人,预售价格在253美元左右,折合人民币仅1583元。这也就意味着它在国内的预售价格很可能只会和英特尔的Core i5 3570K这类四核中端产品相当。强悍的技术规格、适中的价格,是否意味着这头“怪兽”将成为中端用户群值得考虑的选择呢?
FX 8350处理器拥有极高的工作频率,通过智能超频3.0技术的帮助,其8核心工作频率可自动超频到4.1GHz ~4.2GHz使用。
处理器 | AMD FX 8350、AMD FX 8150、英特尔Core i5 3570K |
主板 | 技嘉GA-990FXA-UD7 |
显卡 | RADEON HD 7970 |
内存 | 博帝DDR3 2400 4GB×2 |
硬盘 | OCZ Vertex4 256GB |
电源 | X7-1200 |
操作系统 | Windows7 Ultimate 64bit |
测试目的:主要了解相对于采用推土机微架构的处理器,新一代FX处理器的性能提升幅度,以及在实际应用、游戏中,它是否能为用户带来更好的体验。其次测试更加成熟的32nm工艺、谐振时钟网络技术对于减少处理器功耗、提升处理器的超频能力是否有明显帮助。同时,通过与相近价位英特尔Ivy Bridge Core i5处理器的对比,了解FX 8350处理器是否具备改写中端处理器市场格局的实力。
测试方法:首先我们将通过SiSoftware Sandra、CINEBENCHR11.5、wPrime、Super Pi等基准性能测试软件,以及3ds MAX 2012、Photoshop CS6、Excel 2010、WinRAR 4.2、《尘埃:决战》、《幽灵行动:未来战士》、Prime95等应用软件与游戏,测试新一代FX处理器的处理器性能、内存与缓存性能、应用体验水准、功耗。由于本次进行评测的是定位高FX 8350,因此我们还将采用推土机架构处理器中的顶级产品—FX 8150与其进行对比测试,了解打桩机微架构处理器的性能提升幅度。需要说明的是,在与FX 8150的对比中,我们除了在它们的默认频率设置下进行对比外,还会将两颗处理器的频率手动设置为一致,进行单独的同频性能测试。通过该测试,我们就能准确地知道在完全相同的工作环境下,打桩机核心内部架构的改进幅度。
同时,针对FX 8350处理器定价不高的特点,我们还会采用价格与其相近的英特尔Core i5 3570K处理器进行对比测试。通过它们的对比结果,我们就能了解新一代FX系列处理器是否会给中端处理器市场带来冲击,改变格局。
后,鉴于FX 8350采用更加成熟的32nm工艺,并使用了谐振时钟网络技术,我们还将对FX 8350处理器的超频性能进行详细测试。测试中,我们除了使用传统的风冷超频外,还将通过液氮制冷,对处理器进行极限超频。
测试点评:从测试结果的对比来看,FX 8350的成绩符合期望,在大部分测试中都取得了领先。如在对多线程支持非常不错的SiSoftware Sandra处理器整体性能测试中,相对于FX 8150,FX 8350的测试成绩领先幅度高达11.3%。同时,在多媒体处理性能测试中,FX8350的多媒体整数性能达到206.29MPixel/s。这不仅明显超过FX 8150处理器186.81MPixel/s的处理能力,更大幅度领先与其对比的Core i53570K。
而在浮点性能测试上也不例外,尽管每个模块只有一个共享的浮点单元,FX 系列8核心处理器看似只有4个浮点运算单元,但每个浮点单元内可配备了两个128bit FMAC单元。而这两个运算单元的工作方式非常灵活,既可以根据需要被每个核心单独使用,也可以合并组成一个256位FMAC单元使用,同样具备不可小觑的性能.同时再加上超高工作频率的助力,FX 8350在大部分浮点运算测试中也轻松超过FX 8150与Core i5 3570K。
不过,FX 8350的不足也非常明显,AMD单个浮点运算单元效率不足的缺点在FX 8350上依然得到了继承。无论是在Super Pi一百万位运算,还是在CINEBENCH R11.5单核心渲染这些单线程性能测试中,FX 8350与Core i5 3570K相比都有明显差距。而且比较奇怪的是,经我们多次测试,在Super Pi测试中,FX 8350的耗时略多于FX 8150,未能体现出其高频优势。同时,尽管从推土机架构开始,AMD处理器就对AES指令集提供了支持,但从加密解密性能测试成绩来看,其支持度与英特尔产品相比仍有所不足。
测试点评:尽管根据AMD的技术资料显示,打桩机微架构对缓存部分进行了改进,提升了缓存性能,但从测试结果来看,FX 8350在这部分的测试表现并不抢眼,它与FX 8150的对比只能说是几无改变,各级缓存的访问延迟并未得到明显改善。
内存测试方面,三款处理器都可以对DDR3 1866进行完美支持。总体来看,近一年来推出的中端处理器大都能非常轻松地支持DDR31866。尽管竞争对手的处理器官方标称规格只支持DDR3 1600,但在实际使用中,只要使用相应的内存,对频率、电压进行微调,它们也能轻松将内存频率提升到DDR3 1866甚至更高,而且其内存控制器拥有更好的性能表现。
测试点评:这里的测试结果显然令AFan们激动,在绝大部分测试中,FX 8350都遥遥领先于其他两款处理器,但这样的测试结果也是在我们意料之中的。因为前面的SisoftwareSandra处理器测试中已经显示,这款处理器的整体整数性能与浮点性能都领先于两款对比品。同时,我们也曾提到Sisoftware Sandra是一款对多线程优化很好的性能测试软件,可以充分发挥出处理器的所有性能。而相应的是,当前的不少应用软件也对多线程运算提供了完美支持,可以发挥出处理器的大性能。如3ds Max 2012的MentalRay渲染器、Excel 2010均能够调用处理器的所有浮点单元同时工作。而Winrar压缩软件、Fritz国际象棋步法预测,以及各种转码、编码器则能调动处理器内的所有整数运算单元“火力全开”,发挥出FX 8350的多核优势。
同时值得注意的是,我们不能忽视FX 8350的高频优势,这是它在测试中与FX 8150拉开大幅差距的一大原因。尽管FX 8150的标称智能超频频率可达4GHz,但根据我们的监测,在一些高负载应用,它却很难达到这一频率。如在3D设计业界里流行的3ds Max玻璃马素材渲染测试中(马匹数量已由早期的一匹增加为三匹),它只有大约4颗核心可以工作在3.9GHz,其他4颗核心的工作频率只有3.6GHz左右。而FX 8350在渲染中的5颗核心都工作在4.1GHz,其他3颗核心的工作频率也能保持在4GHz,这令它的渲染时间大幅缩短,已可与定位更高的Core i7 3770K匹敌(渲染时间为428s)。
X 8350(下图)在进行3ds MAX玻璃马素材渲染测试时,处理器各核心的工作频率在4GHz~4.1GHz,而FX 8150(上图)内部半数核心的工作频率都只有3.6GHz。
当然,FX 8350也无法做到“面面俱到”,在对多线程工作支持不佳的应用中仍会出现落后。如在PhotoShop CS6测试里。尽管PhotoShop CS6的一些滤镜效果如光圈模糊滤镜、液化效果滤镜已经可以使用GPU进行加速运算,但像人们常用的色彩转换,使用水彩、凸凹、调色刀等滤镜特效时,还是会交由处理器来完成。但不幸的是,这些工作只会调用处理器的1~2个浮点单元进行工作,因此无法发挥出8核处理器的多核心优势。而AMD单核心浮点单元性能较差的不足则令FX 8350在测试中不能获得较好表现,与Core i53570K相比有较大差距。
在运行PhotoShop CS6凸出滤镜时,只有两颗核心处于工作状态,其他核心都在“休息”。
测试点评:尽管显卡早已成为决定游戏性能的决定性因素,但游戏中大量的AI运算、物理运算(大部分游戏,以及未使用特定显卡的环境时,物理运算的工作仍交由处理器负责)、游戏数据处理仍会由处理器接手。因此在显卡相同的环境下,处理器性能的高低对游戏运行速度仍具备很大影响。从测试来看,除在《幽灵行动4:未来战士》中,速度出现异常降低外,FX 8350在几乎所有测试中都轻松击败FX 8150。
但在与Core i5 3570K对比时,情况则完全不同。FX 8350仅在考察处理器AI运算能力(主要依赖处理器的整数运算性能)的3DMark 06处理器性能、3DMark Vantage处理器AI运算测试中领先,而在大部分的实际游戏测试中,却没有显示出任何优势。我们认为出现这种情况主要有以下几点原因,首先当前各款游戏并不能充分利用FX 8350的多核运算优势。就拿标称支持8核心处理器的《尘埃:决战》来说,它在运行时,大部分核心的占用率大也只有40%右,处理器的运算性能并没有得到充分发挥;《虐杀原形2》虽然也能调动8颗核心工作,但其中6颗核心的占用率只有20%左右,实际上只有两颗核心处于接近满载的状态;而像《街头霸王X铁拳》这类要求不高的游戏,只会调用1~2个线程工作,因此单核心浮点性能更强的特尔处理器在这些测试中就能发挥出它们的优势。
即便是标称支持8核心处理器的《尘埃:决战》,在运行时也无法充分有效利用各个核心,其对处理器的占用率并不高。
测试点评:虽然在运行Prime 95的In-place large FFTs处理器满载测试时,FX 8350系统的功耗比FX 8150的系统功耗高出11W。但要知道的是,在运行这一测试时,FX 8150处理器的运行频率只有3.6GHz,FX 8350的8颗核心运行频率却均达到了4GHz。而在频率增加400MHz后,系统的满载功耗仅多出了不到5%。显然,更成熟的32nm工艺,漏电率的降低,以及谐振时钟网络技术发挥了作用,在频率大幅提高后,处理器的功耗仍能得到有效控制。当然,频率的上升还是会带来一定的副作用,FX 8350的满载温度较FX8150上升了近4℃。
不过,在这里表现突出的还是Core i53570。凭借22nm生产工艺、3D晶体管等技术,以及更少的核心数,它在功耗方面相对于这两款AMD处理器来说都有较大的优势。我们推测,当2013年AMD 28nm核心问世后,AMD处理器的功耗控制水平也将会得到一个大的飞跃。
测试点评:从前面的测试来看,FX 8350在绝大部分测试中都能轻松战胜FX 8150,那么这是“谁”的功劳?为此,我们还进行了一个特别的测试,首先对FX 8350关闭节能技术,并令其稳定工作在4GHz下;其次对FX 8150进行小幅超频,并将它的频率稳定在4GHz,两款处理器将在4GHz相同频率下进行小规模较量。
测试结果一目了然的为我们揭开了谜底,在前文,我们曾提到,FX 8350在SiSoftware Sandra处理器整体性能测试中,相对于FX 8150有11.3%的领先幅度。但在同频条件下,FX 8350的领先幅度被大幅缩小至1.5%,各个测试中,FX 8350大的领先幅度也只有8%,小的甚至只有0.15%。这显示出,打桩机微架构的内部改进并没有给性能带来太大提升,FX 8350真正依赖的还是由成熟工艺、谐振时钟网络技术带来的超高工作频率。因此对于采用打桩机微架构的新一代FX系列处理器来说,高频就等于高能。
测试点评:更加成熟的工艺与新技术不仅帮助FX 8350拥有更高的默认工作频率,更为它带来了更大的超频潜力。由于所有FX系列处理器都未锁倍频,因此在风冷状态下,它的超频方法很简单。只需使用普通的风冷散热器,将处理器核心电压上调到1.55V,倍频提升到x25,你就能获得风冷5GHz的体验。当然,受限于散热性能,处理器在这一频率下仅能完成像Super Pi、wPrime这样的简单测试,无法运行CINEBENCH R11.5之类的高负载任务。而当我们将倍频下调到x24后,处理器的稳定性则大有改善,可以稳定完成各类高负载测试,性能提升幅度达到12.5%~19.3%,其CINEBENCH R11.5多核心渲染测试8.21pts的成绩已超越Core i7 3770K(约7.55pts)。对于追求性价比与实用性的玩家来说,FX 8350提供的“免费午餐”也很丰盛。
测试点评:而对于追求高频率的极限超频玩家来说,FX 8350也不会让人失望。这同样是一颗没有Cold Bug的处理器,只要不断在蒸发皿中倒入液氮,使它长时间处于液氮炮所能达到的低温度下,玩家就能大幅提升处理器核心电压、北桥电压进行超频。不过测试中我们发现,与之前众多的AMD处理器、APU类似。尽管处理器的倍频调节幅度很大,可以任意设置,但如单纯地只通过增加倍频超频,那么在处理器频率超过6.1GHz时,就会出现难以正常启动的情况。因此对FX系列处理器进行极限超频时,好的办法是先将处理器倍频设置为x30.5,以6.1GHz的频率进入系统,再使用主板软件对处理器外频、电压进行细调。
需要注意的是,增加处理器外频后会相应地提升HT总线频率、CPU NB北桥频率、内存频率,因此在超频前,应降低这些子系统的工作倍频。终,通过以上方法,我们在1.96V电压下,成功地将只开启一个模块、两个核心的FX 8350超频到244.03MHz×30.5=7442.83MHz,再次刷新了MC评测室的频率纪录。相信通过使用体质更佳的正式版处理器,以及在超低温液氦的帮助下,各路超频高手在未来还会给我们带来更加惊人的成绩。
不难看出,在更高的工作频率、以及打桩机微架构的帮助下,FX8350处理器不论是在理论性能、应用性能、还是在游戏性能上,较采用推土机微架构的FX 8150处理器都实现了全面提升,并具备很强的超频能力,是一款表现更加优秀的产品,帮助AMD实现了高性能处理器更新换代的目的。同时,由于只是架构上的微调,因此在推土机微架构时AMD处理器就存在的多线程应用表现优异、单核心浮点运算性能不足的特点,也在FX 8350处理器上得到了一一体现。
一方面,凭借CMT多簇式多线程技术架构,FX 8350处理器依然具备很强的整体浮点与整数运算性能,在渲染、转码、商业运算、文件压缩等多线程应用中可得到充分发挥,并能完全压制竞争对手的产品。如FX 8350的3ds MAX 2012的渲染性能不仅完全超越采用Ivy Bridge架构设计的新一代Core i5处理器,更可与价格、定位更高的Core i73770K匹敌。如果在正式上市时,AMD处理器传统的价格优势能得到继承,FX 8350的价格能做到比同级Core i5处理器价格更低,那么对于竞争对手而言,这将是一头颇具攻击性的高频八核“怪兽”。
一方面,由于打桩机微架构只是一个小幅升级产品,因此新一代FX系列处理器依然具备单个浮点运算单元效率不足的缺点,在对8核心或者说8线程计算支持得并不好的应用软件与游戏中,它的表现与竞争对手相比仍有差距。而且FX 8350作为AMD的旗舰级产品,也依然只能与英特尔的中端产品Core i5系列抗衡。
在本次极限超频中,我们成功地在7.41GHz下完成了Super Pi测试,其100万位运算时间被缩短在13秒左右。
而在超频到7.44GHz时,我们成功地进行了CPU-Z认证,各位读者可在CPU-Z官方网站,输入“2545868”这个ID进行查阅。
我们推测,AMD处理器长期遗留下来的问题将在2013年问世、经过大幅调整、着力于提升单核心运算效率的压路机微架构上得到改善。那么压路机微架构进行了怎样的改良?改进后的压路机微架构到底能达到何种水平?是否能对英特尔高端Core i7系列造成威胁?请关注本刊将于近期推出的AMD 压路机微架构技术解析。