核芯显卡和APU的逐步发展,让入门级独显市场的日子变得难过,也使得NVIDIA很久没有关注1000元以下的独显市场了。在新一代集成显卡性能继续提升,和AMD新R9 370等千元级显卡的前后挤压下,基于第一代Maxwell架构的GTX 750系列只能处于不断下调售价来坚守市场的被动局面。如何收拾旧山河?NVIDIA祭出了全新的GTX 950……
GTX 950使用的GM206-250核心架构示意(上),可以看出它和GM206-300核心架构(下)的结构基本一致,只是每个GPC模块中减少了一组SMM单元。
GTX 950 的S M M 单元和GTX 960 完全一致,每个模块不仅包含了128个CUDA流处理器,还包括8个纹理后端。这也就是GTX 950相比GTX 960少256个CUDA的同时还少了16个纹理单元的原因。
按照NVIDIA的说法,GTX 950应该是NVIDIA在GTX 900系列中,部署的基础的GTX产品,用来取代更早的GTX 750系列的市场地位。实际上除了可能会有的双芯型号,GTX 950也应该就是GTX 900系列的后一款新品了,之后NVIDIA将会奔向“帕斯卡”新架构。和GTX 750系列相对GTX 760系列各自使用了不同架构、不同规格的核心不同,GTX 950和GTX 960都使用了GM206核心。也即是说核心架构基本一致,都是GPU-GPC-SMM的三级结构。两者都由两个GPC计算模块组成,SMM单元更是完全一致。区别是前者使用的是GM206-250核心,每个GPC中只有3组SMM,后者的GM206-300核心每个GPC中则有4个SMM单元。每组SMM单元包含128个CUDA流处理器,也即是说在GTX 960完整的1024个核心流处理器规格上,GTX 950屏蔽了256个,仅剩下768个。相应的纹理处理单元也从64个减少到48个。其他诸如光栅单元、显存控制器等规格两者则完全一样。也就是说GTX 950和GTX 960之间的关系其实跟GTX 970和GTX 980之间的关系类似,只不过GTX 950相对GTX 960的计算单元削减比例更大,达到25%,而GTX 970相比GTX 980只少了不到19%。作为替代对象,GTX 750、GTX 750Ti都基于GM107核心,CUDA数量分别为512、640。这么看GTX 950的CUDA数量并没有在GTX 750Ti的基础上增加太多,提升仅20%。就以往测试中GTX 750系列明显不及R9 370的情况来看,我们一开始比较担心GTX 950能否在性能上展示出足够吸引人的优势。当然,GM107是第一代Maxwell架构,成熟度和效率上不及GM206的第二代Maxwell架构。GTX 950的实际性能表现其实超出了我们预期,具体情况如何留待之后的测试环节来揭晓。
TX 950帧延迟优化原理,在缩减每一步骤处理时间的同时,削减了不必要的第二帧预处理时间,让延迟大幅减少。
类似《英雄联盟》、《风暴英雄》这样的MOBA游戏,高端玩家对指令延迟的敏感度是非常高的,GTX 950的延迟降低技术,能在实际游戏中带来画面延迟降低了1/3~1/2的体感效果。
NVIDIA的游戏远程分享大特点就是便利,你只需要发一封邮件给你的朋友,然后他在浏览器中打开你分享的链接就能轻松和你实现同屏游戏。不过在当前国内的网络环境中,GFE打开后还不能看到这个功能模块,当连接到到海外服务器就可以,想要尝鲜的玩家想到办法了吗?
在了解了GTX 950依旧使用同GTX 960一样的GM206核心之后,我们意识到GTX 950应该是近几代GTX x50产品中,规格接近GTX x60型号的入门款GTX显卡。此前的GTX 550、GTX650与GTX 560、GTX 660之间的性能差异都非常明显,因为它们采用的是同代架构中高、低规格差异非常明显的两颗核心。针对这一次GTX 950的跳级现象,我们特地咨询了NVIDIA的相关技术人员。用NVIDIA的话来说,GeForce GTX品牌是NVIDIA对玩家游戏体验的承诺,哪怕是入门的GTX也应该能在当下流行的各类游戏中为玩家们提供足够出色的流畅体验。当下《英雄联盟》、《DOTA2》、《风暴英雄》等一系列游戏的火爆,让MOBA类游戏成为了炙手可热的游戏类型。尤其是近年来电子竞技的快速崛起,更是促进了MOBA游戏的进一步发展。毫无疑问,当前游戏玩家群中,MOBA玩家将占到相当大的比例。在这样的市场环境和玩家关注度下,NVIDIA没有理由不重视MOBA游戏市场。人气的高涨吸引了越来越多的优秀游戏开发者进入MOBA领域,这明显带动了MOBA游戏整体质量的提高。尤其是为了顺应游戏玩家日益高涨的视觉效果需求,新一代的MOBA游戏都在渲染引擎和画质优化上下了更多功夫。让当前的MOBA游戏的画面质量陡升,不再和传统的单机大作形成鲜明对比。这在讨好用户眼球,增加游戏竞争力的同时,也客观提高了MOBA游戏对PC硬件的要求。基于此,NVIDIA不得不慎重考虑GTX 950的核心规格,要满足GTX品牌的承诺,它必须有比以往GTX x50系列相对更出色的规格,所以后大家看到一张和GTX 960使用了相同核心的GTX 950。
如何优化自家产品线以更适应MOBA类游戏,以更好地满足MOBA玩家需求,拉开GTX 950和同级对手的差距?除了逼近GTX 960的性能,让GTX 950在面对当前甚至未来的MOBA游戏时更能游刃有余外,NVIDIA还从玩家实际体验的角度出发,为GTX 950配上了操控流玩家爱的帧延迟优化技术。相对于GTX 650等老产品至少80ms的帧延迟,GTX 950能在相同的条件下将延迟降低到45ms,提升幅度高达44%。这对于手速极快的高手玩家来说绝对是一大助力,将有助于他们更流畅地完成指令,发挥出高手速的技术优势。那么NVIDIA是如何做到的,需要玩家在游戏开始前做特殊设定吗?设定是否复杂?
其实GTX 950的帧延迟优化技术原理并不复杂,弄清楚普通显卡渲染和输出一张画面的过程就能让我们非常清晰地了解这个技术。在此之前,因为显卡性能的相对局限,以及玩家对帧率的更高需求,显卡在渲染一帧画面的时候,会预处理可能会出现的下一帧画面,也就是说一个输出流程包含了指令输入、第一步渲染、第二预渲染和输出四个步骤。按照此前比如GTX 650显卡平均每步骤约20ms的响应时间来看,输出一帧大约就需要80ms。现在GTX 950优化了前端指令处理和输出端处理,再加上性能提升让渲染同一画面的速度提高,所以GTX 950能将平均每一步骤的延迟降低到15ms左右。然后依托于GTX 950较强的性能,NVIDIA觉得不再需要预处理下一帧画面,也能满足玩家对帧率的需求,所以GTX 950的每一个输出流程被简化为指令输入、渲染和输出三个步骤,因此总的每一次输出时间就被缩减到15ms×3=45ms,相比之前的80ms大幅度降低。
更重要的是,帧延迟降低功能并不需要玩家特意设置,新版的GFE(GeForce Experience)软件能自动识别玩家使用的是否是GTX 950显卡,倘若是,那么在MOBA游戏启动后,GFE会自动开启帧延迟降低。由于是GFE内置功能,所以基本上没有游戏兼容性问题,而且在面对渲染压力较大,对帧率更看重的FPS游戏时,GFE还会自动关闭延迟优化,大程度保证流畅帧率。当然,从原理来看,这个技术跟显示核心架构的关联性并不太强,理论上应该也能用在其他GTX 900系列显卡上。只是目前官方宣布GFE软件只能针对GTX 950做出相应优化,后续NVIDIA是否会将这个技术普及到更多型号的显卡上只有敬请期待了。
伴随GTX 950的到来,GFE还增加了另一个堪称“逆天”的功能。玩家们应该知道,之前NVIDIA为了方便游戏主播等特殊人群边玩游戏、边录像直播的刚需,在GFE中添加了ShadowPlay功能。它能优化视频录制、处理过程,将CPU从高压状态解放出来,以便为游戏提供流畅帧率,不因直播而使游戏卡顿。借这个技术的发展,NVIDIA积累了相当丰富的视频流处理经验。以此为基础,NVIDIA在GFE中加入了另一个基于视频流的应用—游戏分享。典型的应用场景就是你在家中玩一款新游戏,却因一个关口始终不能顺利突破而烦恼。在以往,你可能需要大老远将游戏高手朋友请来教你通关,而现在,你可以打开游戏分享功能,让他在远端操控你的电脑完成通关了。效果上有些类似于腾讯QQ早就推出的远程帮助功能,但不同的是,NVIDIA的游戏分享技术具有更低的延迟表现,在光宽带逐渐普及的当下,延迟可以被缩减到100ms以内,拥有跟本机相当的流畅度。另外,NVIDIA的游戏分享还支持双向操作,也就是说当你的朋友远程连接到你的游戏中时,你和他能在游戏中控制不同的角色,像局域网连接一样游戏。而这个模式的“逆天”之处还在于不受游戏支持力度、优化程度的影响,作为集成在GFE中的模块,理论上任何使用了GTX 950显卡的PC,都能在当前游戏中开启该功能。而被你邀请的朋友,他的PC硬件也不会受NVIDIA制约,甚至可以是没有独立显卡的集成显卡平台。有没有瞬间想到用这个功能在家中开启FIFA足球游戏,然后邀请远方的兄弟一起冲击世界杯?原本想到这里就觉得激动,但NVIDIA工程师抱歉的告诉我们这个功能暂时不支持国内环境,主要是需要用到Google的一些服务,导致国内没法正常使用,只有等国内的合作伙伴敲定之后才能开启。坦白说这真是吊足了胃口,简直就像将美食放在玻璃橱柜中只准你看不准你吃一样虐心,只能期待NVIDIA能尽快敲定国内合作伙伴了。
GTX 950在NVIDIA的规划当中自然是有公版频率和公版参考设计,而国内包括媒体都没有收到公版测试样品。与之对应,各个下游厂商在第一时间就送上了非公版的GTX 950评测样卡。MC第一时间收到的是分别来自索泰、七彩虹的两款产品。详细分析产品设计,我们能看出思路上的差异和不同厂商对GTX 950的态度。
CUDA处理器核心 768
基础~提升频率 1203MHz~1405MHz
显存频率 7000MHz
显存规格 2GB/128bit/GDDR5
接口 DisplayPort+HDMI+DVI×2
价格 1399元
6+2相供电设计,皆采用AIO电感加SO-8 MOS管用料,和不少定位更高的中高端显卡用料水平持平。
索泰GTX950-2GD5 GAME HA的外接辅助供电为双6Pin规格,理论供电能力更强,有助于发烧超频玩家挖掘显卡频率极限。
索泰GTX950的做工、用料、设计已经超过市面上的普通GTX 960,甚至超越了不少GTX 970。很显然,这张GTX 950的定位并不墨守成规,借做工、用料的扎实,它成为当前我们所知的所有非公GTX 950中频率高的型号,性能逼近GTX 960。按照官方参数GTX 950的功耗仅90W,外接辅助供电单6Pin已经绰绰有余,而索泰却为GTX950设计了双6Pin,配合上6+2相供电模块,供电能力不可小觑,绝对是想尝试GTX 950超频的玩家的首选。
依旧具备家族式的Turbo开关,能让玩家轻松切换显卡的高、低频率BIOS设置。
3+1相供电加单6Pin的规模相比并不夸张,重在扎实和实用,带给用户更好的性价比。
CUDA处理器核心 768
基础~提升频率 1026MHz~1190MHz/1140MHz~1329MHz
显存频率 6600MHz
显存规格 2GB/128bit/GDDR5
接口 DisplayPort+HDMI+DVI×2
价格 1199元
实用,经典的实用主义,则是iGame GTX 950烈焰战神U给我们的大感受。没有延续高端iGame追求极致的思路,iGame950的追求更多体现在人性化方面,同时让产品价格拥有尽可能高的吸引力。高、低双频率BIOS,通过经典的Turbo开关轻松切换显卡频率状态,让玩家能在高性能和低温、低噪之间自由选择。0噪音温控散热系统更是能根据显卡负载和核心温度,实时调控风扇转速,时刻大化保证使用环境的安静,带给玩家良好的游戏心情。
处理器 酷睿i7 4770K
主板 ROG玩家国度Maximus VII Formula
内存 宇瞻DDR3 2133 4GB×2
硬盘 海盗船Neutron GTX 240GB SSD
+希捷桌面4TB HDD
就在上个月,MC才根据当时的产品情况对显卡市场做过一次梳理(详见本刊2015年8月上刊《显卡新品齐上市 暑期升级如何选?》)。我们当时就指出NVIDIA产品线中的相对不合理,在GTX 960和GTX 750系列之间留有巨大的规格和价格空档,给了AMD错位竞争的机会。所以换代后的R9 370即使在R9 270系列的基础上硬件规格不升反降,也依旧能在千元级市场获得性能优势。很显然,NVIDIA也意识到了这个问题,并没有打算让R9 370独美,GTX 950定价1000元出头,针对性极强。那么同GTX 960使用了一样的GM206核心,拉开和GTX 750系列的规格差距后,GTX 950究竟能在能耗比、性价比上带来怎样的表现,是否能确立自己相对于R9 370甚至R9 380系列的竞争优势?很显然,这将会是我们接下来评测考察的重点。
本次测试的两张GTX 950都是非公版设计,不过好在iGame950烈焰战神U具有双频率设定,其在未开启Turbo模式时的频率跟公版显卡基本一致,具有较好的公版性能参考性。而索泰GTX950-2GD5 GAME HA则代表了当前市面顶级超频版GTX 950的表现。
测试结果发现,公版频率GTX 950相对GTX 960的性能下降幅度并不如规格削减那么严重。GTX 950相对GTX 960的CUDA流处理器减少了25%,但实际性能只降低了大约15%。而且无论是3DMark理论测试还是实际的游戏对比,这个差距幅度都没有什么明显变化。这应该跟GTX 950完整保留了包括光栅单元在内的后端处理模块有关,这让它只损失了计算环节的性能,而预处理、输出等环节性能则跟GTX 960保持完全一致,让其综合性能远比计算模块的差距要小。
当然,以iGame950烈焰战神U Turbo模式和索泰GTX950-2GD5 GAME HA为代表的超公版显卡,因为频率的大幅提升进一步缩小了和GTX 960的差距。尤其是索泰GTX950-2GD5 GAME HA,核心频率比公版高出了近20%,显存也超频了400MHz,这让它在性能测试中的表现基本达到了GTX 960公版的水平。用GTX 950的价格买到GTX 960的性能,毫无疑问这是非常超值的。当然,玩家们也需要付出一些代价,那就是显卡功耗的大幅度提升。我们看到索泰GTX950-2GD5 GAME HA的平台满载功耗逼近了260W,同平台下比性能更好的公版GTX 960还高出了35W。作为对比,没有开启Turbo模式的iGame950烈焰战神U的同平台满载功耗只有212W,比公版设定的GTX 960略低10W。
说到功耗,还得再提Maxwell架构的优秀能耗比。AMD新的R9 300系列相比R9 200系列,在同定位的产品上已经大幅度优化了功耗,这让公版频率的R9 370同平台满载功耗成绩看起来比公版频率的GTX 950还略低几瓦。但仔细对比3DMark和游戏的实际测试成绩大家会发现,R9 370的实际游戏性能仅能达到GTX 950的75%左右。就这样看,无论是能耗比还是性价比,GTX 950上市之后R9 370都将明显处于劣势。其实就实际游戏性能来说,在我们测试的几款游戏中,GTX 950的表现已经可以和对手定位更高的R9 380处于同一水平,甚至略微领先。
理论测试中GTX 950的表现相对没那么抢眼,表现得比较规矩,高于同级对手R9 370而明显不及对手的R9 380。但实际游戏中,GTX 950已经看齐了R9 380。
当前的千元级显卡性能普遍水涨船高,1080p分辨率玩MOBA游戏帧率已经“爆表”,即使将分辨率提高到2560×1440,也能非常流畅地运行《英雄联盟》。
当然,对换代对象GTX 750系列来说,GTX 950的表现也是相当喜人的。GTX 950的理论3DMark测试软件成绩相比GTX 750Ti提高了40%以上,实际游戏平均帧率也有30%以上的明显提升。借此,GTX 950的性能水平其实已经和上一代的中端甜点GTX 760相当。要知道GTX 760拥有1152个CUDA单元和256bit位宽的规模,相比之下GTX 960仅768个CUDA,换算下来基于第二代Maxwell架构的GM206核心的每一个CUDA单元的效率几乎达到了Kepler的1.5倍。拥有这样的表现却仅被NVIDIA定义为MOBA专属,GTX 950的实际性能表现有被低估的嫌疑。至少在我们的测试中,当前MOBA游戏的代表《英雄联盟》在帧率上对GTX 950完全够不上威胁,常见的1080p分辨率高画质下,GTX 950的平均帧都已经超过150fps了,是60fps流畅标准的2.5倍。即使把分辨率大幅提高到2560×1440,GTX 950也能为玩家提供85fps以上的平均帧,依旧远超60fps的流畅标准。实际上除了MOBA,在当前流行的网络对战类游戏《坦克世界》中,GTX 950的表现也相当出色,全程平均帧达到了60fps的流畅标准。而《坦克世界》在我们以往测试过的网络游戏中,已经属于对硬件要求较高的游戏,这样看GTX 950拿下绝大多数在线游戏完全不在话下。就算是《Far Cry 4》这类集成了众多新技术、新特效的FPS游戏,GTX 950也能在1080p分辨率下提供高特效,并保持基本流畅。由此看,稍微降低一些特效标准,GTX 950就完全可以带玩家畅玩FPS大作了。
从来没有哪一次评测主流的GTX x50显卡让我们如此兴奋过,和中端主力GTX 960使用同样的核心,这注定了GTX 950的表现非凡。尤其是借助Maxwell架构超高能耗比的优势,让GTX 950在千元级市场上建立起性价比、能耗比上的双重优势。可以说是近几代显卡中,超值的主流产品。就实际测试来看,它已经超过了NVIDIA对它的官方预期,不仅能完美提供MOBA游戏体验,甚至能通吃网络对战和FPS类游戏。美中不足的是,伴随GTX 950而来的GFE游戏远程分享功能在国内完全不接地气,可能会让有心尝鲜的玩家等待不少时间。不过就NVIDIA推出的延迟降低和游戏分享来看,NVIDIA独显产品正越来越清晰地走在软、硬件并行的模式上。而这一切的基础和原动力就是更好的玩家体验,毫无疑问这是供需双方都期待的良性循环。当然产品、功能好不好,还得等更多玩家体验到GTX 950之后,用口碑说话,用后继的市场表现去证明一切。