在GTX 980发布之时,MC就成功预判过NVIDIA的Maxwell架构还会有一款更高端的核心来主宰顶级市场,随后GTX TITAN X的发布证实了我们的猜测。然而,当我们在GTX TITAN X的技术沟通会上看到GM200核心和GM204核心间的巨大差异时,我们又有了GTX TITAN X绝不是Maxwell后一款产品的猜测。在GTX 980和GTX TITAN X之间,势必会有一款更甜点的显卡来填补两者价格和规格上巨大的双重空白。只是我们没有想到的是,为此而来的GTX 980Ti在规格上竟和GTX TITAN X如此接近……
GM200再发力 GeForce GTX 980“钛”能量!
GTX 980Ti依旧基于GM200核心,细分型号为GM200-310,定位略低于GTX TITAN X的GM200-400。两者的实际规格差距并不大,GM200-310核心依旧采用GPU-GPC-SMM三层架构。GM200-400的1GPU=6GPC×4SMM,每个SMM下拥有128个CUDA单元,总计就是3072个CUDA单元,而GM200-310只是在此基础上,削减了一个GPC中的两组SMM单元,即1GPU=5GPC×4SMM+1GPC×2SMM,总计2816个CUDA单元。也就是说GTX 980Ti的CUDA单元仅比GTX TITAN X少8.3%,与之对应的纹理单元从192个减少到176,也是减少8.3%。其他诸如光栅单元、显存位宽、显存频率、核心频率等在内的主要参数两者都完全一致。倘若每个单元计算的效率一致,那么理论上GTX 980Ti的计算性能也就仅比GTX TITAN X低8%左右。而命名上,看似与GTX 980Ti比较接近的GTX 980只有4个GPC单元,CUDA数量仅2048个,比GTX 980Ti少了37.5%,光栅单元和显存位宽更是相差50%。倘若按照这样的规格比例定价,GTX 980Ti的价格无疑会远超GTX 980的4000元区间,更接近GTX TITAN X的8000元价位。但实际上GTX 980Ti的上市价格仅4999元,从价格、规格关系来看,GTX 980Ti无疑是当前甜点的NVIDIA高端产品。
GM200-310(GTX 980Ti)核心架构跟GM200-400(GTX TITAN X)一致,SMM结构完全一样,GPC也都是6个,只是GTX 980Ti其中的一个GPC只有2个SMM单元,因此少了256个CUDA单元。
当然,实惠还有另一个代价,相比GTX TITAN X搭配的12GB GDDR5显存,GTX 980Ti减半为6GB。在GTX TITAN X发布时,NVIDIA宣称它是当时唯一针对4K游戏优化的显卡,原因之一就是超过10GB的显存容量能满足4K分辨率下超高清纹理、材质对显存容量的超高要求。现在发布GTX 980Ti,NVIDIA也依旧宣称它是适合4K游戏的显卡,这显得有些乌龙,但在我们看来,这恰恰是NVIDIA终于对4K游戏的实际状况松了口。在测试GTX TITAN X时,我们特意关注了当前4K游戏的显存占用情况,结果却显示12GB显存容量这个配置其实非常浪费,绝大多数游戏即使打开所有特效,也很少用到超过4GB的显存。这是因为当前游戏即使支持4K分辨率,也很难提供真正的4K超高清纹理,而是将1080p水平的纹理进行了优化、拉伸。只有在少数演示DEMO或者专为4K分辨率超高清纹理而设计的游戏中,我们才能看到超过6GB,甚至高达10GB的显存占用量。但这类游戏更像是特意为测试显卡而生,游戏吸引力远不及《Far Cry》、《蝙蝠侠》等作品,实际没有多少人玩。所以从当前玩家正在关注的游戏出发,GTX 980Ti的6GB显存显然不是4K超高清分辨率游戏的主要瓶颈。当然,面对未来会越来越多的超高清纹理游戏,GTX 980Ti也许会更容易遇到爆显存的危机,但目前而言,主流游戏还不能给6GB显存带来太大的挑战。
由于核心和GTX TITAN X更接近,所以GTX 980Ti公版显卡的设计几乎和公版GTX TITAN X如出一辙。两者主要的不同就是外观配色,而内部PCB和散热设计上,我们很仔细地对比了两者的异同,除了显存颗粒,GTX 980Ti公版显卡的PCB从设计、用料到具体的芯片选择都完全一致。因为显存容量减半,但位宽不变,所以GTX 980Ti的显存颗粒规格和GTX TITAN X有所不同,GTX TITAN X使用了SK海力士颗粒共计24颗,构成384bit、12GB规格,而GTX 980Ti则只使用了12颗SK现代颗粒,组成384bit、6GB规格。体现在PCB上就是GTX 980Ti的PCB背面没有显存颗粒,而GTX TITAN X正反皆有12颗,至于显存频率,两者都一致为7000MHz。
公版GTX 980Ti(左)跟GTX TITAN X一样使用了6+2相数字供电设计,连使用的钽电容、贴片电感加DE38AL一体化集成MOSFET管都完全一致。
值得一提的是公版GTX 980Ti显卡的料件选用规格,秉承了GTX TITAN X的高规格,6+2相数字供电,搭配钽电容、贴片电感加DE38AL一体化集成MOSFET管。这套设计在GTX TITAN X上的口碑不错,尤其是困扰高端玩家的高频啸叫问题并未普遍发生,已经足以证明这套用料的品质。当然,电流精确控制,均摊负载的工作对数字供电系统来说也是非常重要的功能、,关系到系统运作的稳定性甚至使用寿命。鉴于安森美NCP81174 PWM数字主控大只能控制4相供电,所以GTX 980Ti和GTX TITAN X一样,使用了NCP81174×1加81162×3的控制器组建方式,以满足6+2相数字供电的需要。从这个角度来看,这代NVIDIA旗舰显卡的用料和设计水平都相当可靠,非公版的大意义可能在散热器的改进上。当然,这并不是在说公版GTX 980Ti使用的散热器不够好,实际上GTX 980Ti的散热系统用料规格相当奢侈,比如散热鳍片和GPU核心的接触面使用的是成本相对贵的均热板技术,一体式金属框架还兼顾了显存散热。只是说坚持采用热量外排的风道设计理念,限制了这套散热器的性能。这种涡轮侧吹设计,在以往的对比中,相比非公版显卡常用的下压式多风扇系统总会在风量、噪音上明显落后。这也终导致公版显卡的工作温度偏高,而且风扇往往会高速旋转以满足高负载状态的散热需求,伴随而来的就是噪音控制能力也相对有限。它的唯一好处是能尽量少地将热量排放到机箱内,对其他设备产生散热方面的负面影响。但实际使用中,下压散热设计产生负面影响并不明显,但却能明显改善显卡的高负载工作温度和发热状况,而这也是MC推崇优秀非公版显卡的一大原因。
GTX 980Ti(左)和GTX TITAN X一样,使用了安森美NCP81174 PWM数字主控,以及三颗81162数字控制器,且这四颗芯片被安放在单独的PCB上。
同样是GM200核心,GTX 980Ti(左)采用了GM200-310的型号,比GTX TITAN X的GM200-400定位稍低。
GTX 980Ti(左)使用SK海力士32bit×128M颗粒,12颗组成384bit、6GB规格。GTX TITAN X则使用的是SK海力士16bit×128M颗粒,24颗组成384bit、12GB规格。
当然,依旧基于Maxwell架构,所以在测试GTX 980和GTX TITAN X时,我们曾提到过的包括VR、DSR、VXGI等一系列特色技术,GTX 980Ti都完美支持。与之前不同的是,伴随GTX 980Ti的发布,NVIDIA在VR渲染的算法上进行了改进,为我们带来了计算效率更高的多重分辨率渲染方式。传统渲染中,要抵消VR眼镜设备带来的鱼眼畸变,只有渲染更多像素,后又在扭曲形变中将它们抛弃掉。这种“多余”的工作势必会带来显卡的额外负担,在VR对显卡性能要求非常苛刻的当下,每一分性能的节俭都能帮助玩家获得更好体验。因此NVIDIA从GTX 980Ti开始启用了一种新的多重分辨率着色技术。多重分辨率着色能在正式渲染前,将VR需要渲染显示的图像划分为多个视区,然后按照比例缩放边缘,以保障显卡渲染的结果就是终的扭曲图像。也就是说GPU不会再像传统方式一样去渲染许多根本不会出现在屏幕上的像素,借此可以在实际VR游戏中为NVIDIA显卡带来1.3甚至更高的计算效率,让虚拟现实游戏体验更流畅,尤其是下代VR眼镜普遍将刷新率从75Hz提高到90Hz的前提下,这项技术能为NVIDIA 建立更明显的同级竞争优势。
GTX 980、GTX 980Ti、GTX TITAN X外观对比展示,外观配色上GTX 980Ti和GTX 980几乎一样,并没有传承GTX TITAN X的全黑金属外壳设计。
GTX 980、GTX 980Ti、GTX TITAN X接口对比,清一色地采用了DP×3+HDMI+DVI的配置。
GTX 980、GTX 980Ti、GTX TITAN X(从上往下)外接供电对比,GTX 980Ti和GTX TITAN X一样是8Pin+6Pin配置,供电需求明显比GTX 980的双6Pin更高。
遗憾的是,说了这么多关于VR的新内容,但当前的VR测试环境依旧不成熟,我们还是只能在常规游戏中体验GTX 980Ti带给我们的改变。接下来我们将实际体验GTX 980Ti分别在1080p分辨率和4K分辨率下的游戏表现,以及GTX 980Ti在高负载工作状态中的温度、功耗情况,看看它的能耗比表现是否足够让人满意。
首先是理论测试成绩,1080p分辨率下,GTX 980Ti表现出了与硬件规格相匹配的性能。测试成绩普遍比GTX 980高出40%左右,这和两者间的流处理器数量差距基本相当。而GTX 980Ti和GTX TITAN X的差距也基本在8%之间,依旧和两者间的流处理器数量差距相当。可以说当前的理论测试软件基本上能充分挖掘核心设计思路,将性能发挥得比较出色,至少在Maxwell架构上显现出了非常明显的线性变化。但反应到实际游戏中则多少有些打折,游戏针对单一显示架构的优化力度不一,再加上游戏在帧数“富余”状态时的性能管理策略不一,所以GTX 980Ti的实际游戏测试成绩了并没能全面领先GTX 980 40%。只有在《怪物猎人》、《Far Cry 4》、《地铁:后的曙光》等游戏中保持了40%左右的帧数优势。仔细分析不难发现,这类游戏都是本次测试中对显卡性能要求相对较高的,显卡性能不存在明显的富余。这就导致游戏过程中,系统会尽量榨干显卡的计算性能,能大化各自的性能差异。反观《蝙蝠侠:阿卡姆起源》等游戏,GTX 980、R9 290X档次的显卡都已经出现性能富余,能将平均帧稳定在130fps左右,此时系统对显示核心的性能压榨并不严苛,GTX 980Ti、GTX TITAN X等显然未尽全力,所以看起来帧数领先不多。
公版的GTX 980Ti PCB布局(下)上则和GTX TITAN X(上)几乎完全一致,唯一的区别是背面少了12颗显存颗粒。
公版GTX 980Ti(左)的散热鳍片与GPU的接触面也采用了均热板设计,和GTX TITAN X如出一辙。
值得注意的是,以《Far Cry 4》为代表的新游戏拥有较多的新特效,尤其是专属的“NVIDIA”顶级画质,依靠和NVIDIA Gameworks的紧密合作,能充分展现毛皮、光影、光线散射等多种新特效,带来电影级画质的同时,对显卡的性能要求也更高。而对比“顶级画质”和“NVIDIA”画质下的测试成绩,我们会发现GTX 980Ti在更严苛的“NVIDIA”画质中的领先优势反而更大。这再一次证明优化的重要性,通用API下的表现显然不能完全体现NVIDIA的新架构优势,而专属的“NVIDIA”模式,则将其特色充分发挥了出来。只是这种专属优化的代价就是封闭,AMD显卡没法开启这个设置,自然也就无从比较了。只是在绝大多数游戏中,GTX 980Ti的成绩都领先AMD R9 290X超过了50%。以此来看,AMD新旗舰要获得超过50%的性能提升才有可能在未来的单芯卡皇争夺战保留胜利的希望,这个难度无疑是非常大的。
传统方式渲染画面(左)和多重分辨率着色渲染画面对比,传统方式渲染了太多不会显示的图像边缘,导致了性能浪费、帧率更低。
很早之前,微软就在公开场合宣称DirectX12是一个非常先进的API,除了能大幅度提高处理器运行效率外,其中一个重点就是能够支持众多老架构的GPU。例如一开始曝光的GTX 200系列以及老GCN架构的HD 7000系列等都能支持DX12。但实际上,微软的DX12有特效分级,能运行DX12游戏并不意味着能支持游戏中的所有DX 12特效。在GTX 980 Ti的发布会上我们获知,Maxwell架构是当下唯一能完美支持包含烟雾、遮蔽等DX12代表性新特效的显示核心架构。而此前的Kepler以及更早之前的GTX 200等系列只能支持基础运行,能运用的特效则跟DX11游戏没有太大区别。
NVIDIA宣称GTX 980Ti和GTX TITAN X一样是当下适合在4K分辨率下玩游戏的显卡,因为它们都有相对较大的显存容量,比此前搭载4GB显存的顶级显卡常更适合高分辨率游戏。然而我们在测试GTX TITAN X时,就已经发现当前4K超高分辨率游戏的主要瓶颈并非显存容量,而是图形计算性能。尤其是在4K超高分辨率下,还要开启所有特效和抗锯齿设定,此时对显示核心的性能要求极高,哪怕是GTX TITAN X也未必能在所有游戏中提供流畅的游戏体验。所以针对GTX 980Ti的实际4K游戏测试,我们一开始就没有报太大希望。实际情况和我们想象的类似,在没开启抗锯齿和高资源占用特效的前提下,GTX 980Ti和GTX TITAN X还能在《古墓丽影9》、《怪物猎人Online》、《Far Cry4》和《蝙蝠侠:阿卡姆起源》中保持流畅。一旦开启抗锯齿或者特殊的特效,即使是GTX TITAN X都不能保证《怪物猎人Online》、《Far Cry4》等游戏能在4K分辨率下流畅运行,就更别说GTX980Ti了。当然,从实际帧率来讲,GTX 980Ti在4K分辨率下的表现其实已经非常接近GTX TITAN X了,GTX 980Ti跑不流畅的,GTX TITAN X一样也不行。由此看,MC依旧保留我们此前的结论,当前要想流畅运行4K游戏,只能依靠多卡互联系统,前提还得是你想玩的游戏对SLI等多卡互联技术支持力度较好,效率较高。
《Far Cry 4》1080p分辨率测试成绩对比一览,GTX 980Ti在“NVIDIA”专属画质下较GTX 980的领先优势更大。
《古墓丽影9》1080p分辨率测试成绩对比一览,如《古墓丽影9》一样,在大多数游戏中,GTX 980Ti相比R9 290X都保持了50%以上的优势。
处理器 酷睿i7 4770K
主板 ROG玩家国度Maximus VII Formula
内存 宇瞻DDR3 2133 4GB×2
硬盘 海盗船Neutron GTX 240GB SSD+希捷桌面4TB HDD
电源 Tt ToughPower XT 1275W
《Far Cry 4》4K分辨率测试成绩对比一览,此时在“NVIDIA”顶级特效下,已经没有显卡能提供流畅的帧率。
《古墓丽影9》4K分辨率测试成绩对比一览,只有GTX 980Ti和GTX TITAN X能在顶级画质依旧流畅运行。
后是温度、功耗表现,就公版显卡的做工来说,GTX 980Ti无可挑剔,但是前文我们有提到,散热器结构决定了它的散热性能和噪音表现难以出彩。我们实际拷机测试发现核心温度很快便升高到85℃左右,此时应该已经达到核心温度、功耗控制上限,限制系统开始运作,显卡核心频率开始下降。此后核心温度稳定在85℃,此时风扇噪音已经达到53dB,噪音已经非常明显,远不及非公版卡普遍42dB~46dB的工作噪音成绩。至于功耗,拷机时GTX 980Ti的平台功耗和GTX TITAN X非常接近,显存差异可能会有细微的影响,整体来说这两张卡的功耗表现基本没有差别,都比GTX 980高出了70W以上,能耗比略低于GTX 980。当然,在AMD新的顶级单芯卡出现之前,NVIDIA无疑能借Maxwell保持能耗比优势,对比AMD R9 290X满载时超过400W的整机功耗,GTX 980Ti表现无疑是非常出色的,在性能高出50%的提前下,功耗还低了40W左右。
GTX 980Ti能有接近GTX TITAN X的游戏性能,这个结果并不意外,因为GTX 980Ti的硬件规格本就非常接近GTX TITAN X。相比性能,GTX 980Ti在价格上与GTX TITAN X拉开了相当大差距才是我们关注的重点。很显然,GTX 980Ti的出场并不简单地为了弥补GTX 980和GTX TITAN X之间的硬件规格差异和价格鸿沟,它还有迎战对手新一代显卡的重任。竞争对消费者来说绝对是好事,“开战”前NVIDIA就已经变相降低了顶级GM200核心产品的价格。从NVIDIA高规格、低价格的谨慎布局布来看,接下来的新一代单芯游戏显卡王座之争应该非常值得期待,究竟是GTX 980Ti捍卫Maxwell的荣誉,还是AMD Fiji(继R9 290X之后AMD新的旗舰单核心)展现后来居上的好戏,让我们拭目以待。