历史上,3DMar k系列测试软件,一直是计算机图形系统性能的代言人。从3DMark 99开始到随后的3DMark 2000、3DMark 2003、3DMark 2005以及比较新的3DMark Vantage和3DMark 11,“3DMark”后面总跟随着数字或者单词,要么表示其发布时间,要么表示它的商业意义(只有3DMark Vantage这一代是这种情况)。而此次新的3DMark在命名上却没有任何后缀,耐人寻味。这充分说明,FutureMark想通过这款新的软件传递出不同的声音。没错,大音希声、大象无形,3DMark,这是一款统一、全面、权威的图形系统测试软件。
苹果在发布首款使用视网膜屏幕的iPad时,并没有像大家意料中的那样将其命名为iPad 3,而是直接起名为the new iPad,凸显其新一代的地位和特征。与此类似的是,在新一代3DMark的命名上,Future Mark也采用了同样的方式,将测试软件直接命名为3DMark,放弃了所有的后缀,凸显新3DMark本身的定位:这是一款全方位、多功能的测试软件(以下本文将用“新3DMark”来代指本次Future Mark新发布的3DMark,以区别3DMark的其他版本)。新3DMark在测试体系上有很多重大改进,甚至和之前的3DMark完全不同。下面让我们一起走进新3DMark的世界。
新3DMark重大的改进就是对全平台的支持。根据新3DMark白皮书的消息,在新3DMark的3种测试场景中,对硬件要求低的Ice Storm模式支持Windows、Windows RT、Android和苹果的iOS系统,而另外的Cloud Gate和Fire Strike模式则只能运行在Windows和Windows RT上。
新3DMark在Windows平台上使用的是微软自家的DirectX(可能是D3D Feature Level 9.1),在Android等移动平台上则使用的是OpenGL ES 2.0。在移动平台上,新3DMark使用了固定分辨率进行渲染,再缩放输出到不同设备上的测试方法,避免了不同设备由于不同分辨率给测试结果带来的影响。虽然新3DMark已经尽可能做到兼容了,但是部分设备还是无法运行,为此新3DMark白皮书也给出了说明:
Android设备:至少使用Android 3.1以上的系统、1GB内存、OpenGL ES 2.0兼容核心,300MB的存储空间。有关CPU的需求尚未确定。
Windows RT设备:虽然从理论上来说,所有使用Windows RT的产品都可以运行新3DMark,但部分设备由于配置实在太低,可能无法完成测试。目前FutureMark正在准备在Windows RT系统上运行的设备的推荐名单。
iOS设备:目前新3DMark暂时仅支持iOS 5.0系统,只能支持iPhone 4、iPad 2、第五代iPod Touch三款设备,需要300MB的存储空间。
新3DMark对iOS的支持很有限,不仅产品数量较少,操作系统也不支持新的iOS6,新的iPad 4也没有出现在支持列表中。
在PC端图形性能的考察上,新3DMark更为全面。新3DMark内含了DirectX 11下的D3D Feature Level 9.1(可能依旧是移动平台使用)、D3D Feature Level 9.3、D3D Feature Level 10.0和D3DFeature Level 11.0四种不同的Direct3D等级,几乎对近几代的显卡做到了全兼容。
为了确保新3DMark跨平台和对硬件广泛的支持,新3DMark基于DirectX11设计了三个不同的测试场景,分别支持不同的Direct3D Feature Level。其中名为Ice Storm的场景需要D3D FeatureLevel 9.1或D3D Feature Level 9.3(也有OpenGL ES 2.0版本),CloudGate场景需要D3D Feature Level 10.0,Fire Strike模式则需要D3DFeature Level 11。做出这样的改变,和新3DMark在测试平台和分数统计上的改变有关。
总的来看,和传统3DMark只能支持某个确定的DirectX的做法完全不同,新3DMark主动兼容了近几代的DirectX版本,这和新的3DMark希望支持ARM、x86以及Windows、iOS、Android、WindowsRT全平台测试是有关系的。
在老版本的3DMark中,场景分是总分统计中的一部分。比如在3DMark 11中,总分是根据不同场景综合测试得来,不同的场景在测试中有各自不同的任务和需求。比如部分测试倾向于全面性能考察,部分测试倾向于对CPU、GPU的特定性能比如物理加速、纹理、像素填充等能力的考察。
新3DMark现在不再给出总分,改用场景分数来代替之前的统计方式,即每个场景都有一个独立的分数。这是一个非常重要的变革。用户在宣布分数时,如果说“我的显卡在新3DMark中得到了4500分”,是不正确的,正确的说法是:“我的显卡在Fire Strike场景中得到了4500分。”
新3DMark做出这样的变化,主要有两个原因。首先是新3DMark各个场景采用了完全不同的Direct3D Feature Level,这就导致了部分显卡无法运行新3DMark的某些测试场景。如果采用总分统一计算的话,很难保证终数据的有效性和准确性。其次,FutureMark希望将新3DMark打造成全平台测试软件,因此不同等级的场景可以用于不同平台的测试。比如在目前的Android或者Windows RT上,由于性能较差、支持规格较低,因此肯定无法运行Fire Strike这种使用D3D Feature Level 11的场景,只能退而求其次运行Ice Storm。在比较分数时,只有按照场景计算分数,才能充分地比较不同平台之间的差异。从总分计算的角度来看,新3DMark的场景分更像是为每个场景设计的“总分”,和老3DMark相比,场景分只是之前总分“分割后”的结果。如果将新3DMark分割成3DMark DX9、3DMarkDX10、3DMark DX11三个不同的测试软件的话,如今的计算方法将得到三个总分。特别值得一提的是,新3DMark的分数统计和3DMark 11有很深的渊源,不但权重和3DMark 11基本相当,连一些关键性的参数都和3DMark 11完全相同。
一般用户使用3DMark,关注的就是分数,但其实还有很多信息隐藏在分数背后。对一些要求比较苛刻的玩家来说,希望能实时观察到帧率图、GPU和CPU的温度等详细信息,老3DMark是不会给玩家提供这些信息的。新3DMark都已经为用户准备好了,包括系统信息、CPU温度、GPU温度、CPU功耗都能一一进行展示。
这里值得一提的是,新3DMark的一个鲜明改变是在后结果输出时会生成帧率曲线图。用户可以根据该帧率曲线图详细分析帧数变动情况,例如一些存在帧数暴跌情况的显卡,虽然可能终得分很高,但是偶尔帧暴跌也会带来很明显的卡顿现象,在新3DMark中都可以得到充分的反映。
对之前部分用户采用显卡驱动程序锁定某些选项(比如曲面细分等级、纹理等级)获取“不正常”的高分数的情况,新3DMark似乎没有太多检测手段,依旧只能依靠有经验的用户通过观察具体的帧率、曲线图等来进行判断。
除了目前已经设定好的三个测试场景外,新3DMark还给出了自定义测试环节。在自定义测试中,玩家可以选择大量的细节选项,比如MSAA等级、曲面细分级数、材质过滤方式、环境光遮蔽质量等级、焦外模糊效果的质量等级以及基本的分辨率、运行方式等。用户可以根据自己的需求进行调整测试,获取自己需要的信息。当然,使用自定义方式测试的成绩,是不会获得终的分数的。
新3DMark使用了全新的测试场景,在前文已经反复出现过它们的名字了。在接下来的内容中,本文将对具体测试场景进行解析。目前FutureMark官方没有给出各个场景所使用的技术的详细情况,只是简单地说明了各个场景使用的一些资源情况等,内容还不够丰富。
1.综述
Ice Strom是新3DMark测试中负载轻的一个场景。这个场景的要求也很低,只要显卡硬件支持Direct3D Feature level 9.x,驱动支持WDDM 1.1以及拥有128MB显存即可运行本测试。测试分辨率是1280×720。
从技术角度来说,Ice Strom使用的图形技术大多基于Direct3D Feature level 9.x。至于它和之前的3DMark 06有什么区别,新3DMark白皮书表示,3DMark 06使用的是DirectX 9,并且当时只有高端PC才有机会流畅运行。而新3DMark中的Ice Strom使用的是DirectX 11,是专为中低端PC、笔记本电脑、集成显卡用户以及高性能移动设备设计的。由于需要照顾的设备众多,Ice Strom使用了off-screen渲染,即先渲染好画面,再用缩放的方式在屏幕上完成显示。
2.测试场景
a.在Ice Strom场景中,包含了两个图形测试和一个物理测试
b.是唯一可以在Windows、Windows RT、iOS、Android设备上同时进行横向比较的测试场景。
c.图形测试一:包含了大量的顶点测试内容,像素负载不高。平均下来每帧拥有530000个顶点、18万个需要光栅化的三角形以及大约470万个像素计算。
d.图形测试二:包含大量的像素测试内容,顶点负载不高。平均每帧有1260万个像素计算,相比图形测试一,新加入的像素计算负载来自于粒子、泛光、运动模糊以及streaks(条纹)。此外,本测试中不需要绘制阴影,多边形也大幅度降低,因此顶点测试降低至只有75000个需要计算。
e.物理测试:Ice Strom的物理测试从画面上看是8个泡泡球弹性碰撞的模拟效果测试。在物理测试时,GPU图形部分的负载保持在低值,避免给CPU造成性能影响。4个模拟系统(每个占用一个CPU线程),每个系统有2个软体和2个刚体在一起运动。所有的物理模拟都在CPU上完成,软体顶点数据只在每一帧前更新至CPU处。所有的(包含所有的三个测试场景,不仅仅是Ice Strome)物理测试都使用开源的Bullet物理引擎,并没有使用到GPU模拟。
f.测试引擎:3DMark也给出了一些说明,比如测试使用了传统的渲染方式(目前延迟渲染似乎更流行);场景更新和可见性计算使用了多线程的方法;所有的绘制命令都是由单线程发出;表面光照使用了镜面反射计算方法;支持的光照种类也比较丰富,包括无阴影的点光源、带有阴影贴图的光照等;支持透明粒子和几何体等。
g.测试设置:可选设置非常少。测试默认没有开启抗锯齿(可选高8x)、阴影贴图也只有1024(可选高2048)、纹理过滤默认使用了三线性过滤(可选AF16x)。
3.测试看点
Ice Strom场景的分辨率较低,采用的只是基本的图形显示技术,画面看起来一般。它没有太多动态光照效果和出色的阴影效果,画面缺乏动感。场景设计方面,IceStrom有点类似3DMark Vantage中太空战的场景,场景方面算是比较有想象力吧。
1.综述
Cloud Gate场景的要求也不算高,显卡硬件支持被提升到Direct3D Feature level 10.0,分辨率依旧只能支持到1280×720。和之前的3DMark Vantage相比,Cloud Gate使用的是DirectX11中支持DirectX 10特性的Direct3D Feature level 10.0,拥有更多的现代特性。这个场景需要显卡的显存大于256MB。
2.测试场景
a.包含了两个图形测试和一个物理测试
b.图形测试一:重点测试几何处理器,也包含了一些简单的像素处理。每一帧平均有超过300万个顶点,产生45万个几何基元,终结果是需要做110万个三角形光栅化,像素处理上超过180万个。在测试中体积光照是关闭的(与演示Demo不同),粒子效果依旧保持。图形后处理中增加了基于快速傅立叶变换的泛光和景深效果。
c.图形测试二:重点偏向于像素处理,几何处理会大幅度降低。平均每帧拥有180万个的顶点、34万个几何基元,终处理69万个光栅化三角形。体积照明被打开但也去除了粒子效果,后处理器依旧使用了泛光和景深。
d.物理测试:Could Gate的物理部分场景和Ice Strom完全不同了,主要模拟的对象也从泡泡变成了类似植被、布料的测试。这个部分的测试模拟系统增加到32个,每个系统有4个软体、4个纠缠体和20个刚体,刚体主要用于给软体带来冲击效果,本身是不可见的。此外,每个模拟系统还拥有一个粒子模拟系统。测试耗时20秒,但统计从第8秒开始,前8秒主要用于确保所有的对象都开始参与模拟过程。
e.测试引擎:Cloud Gate的测试引擎来自于Fire Strike,去掉了一些Direct3D Feature level10无法支持的功能,光照叶蓓进一步简化。此外,这个引擎依旧可以运行在Windows RT上,但要求显卡支持Direct3D Feature level 10。
f.测试设置:由于引擎等级明显提高,因此在Cloud Gate中所能设置的对象就大大增多。包括泛光、体积光、环境光、景深、色彩饱和度等设置都出现在测试的设置面板中。默认设置包括4个阴影采样、1024的阴影贴图分辨率、景深质量是“低”,泛光分辨率被设置为1/8。
3.测试看点
Cou ld Gate明显的特点就是光照和阴影效果大幅度提升,至少体积光、泛光效果、景深效果的加入让画面好了很多。用户可以手动设置图形部分并观看Demo来体验一下DirectX 10时代的画面感觉。
1.综述
Fire Strike是新3DMark测试中使用技术先进的测试场景。它完全基于DirectX 11Direct3D Feature Level 11设计,采用了诸如曲面细分、位移贴图、环境光遮蔽、粒子照明系统、烟雾模拟等先进技术,打造了一个画质极为精美的测试场景。和3DMark 11相比,FireStrike技术应用更为先进,测试分辨率更高,更适合作为当下主流显卡的测试基准使用。
Fire Strike分为Performance(1920×1080的分辨率)和Extreme两种模式。Extreme模式的测试分辨率提升到2560×1440,部分性能选项也大幅度提升,对显卡的性能要求更高,即使是目前顶级的单核心显卡也很难流畅运行该场景,是专门为多路测试系统准备的超级测试场景。当然,2560×1440的分辨率要求显卡的显存容量提升到1.5GB。
2.测试场景
a.包含了两个图形测试、一个物理测试和一个综合测试。
b.图形测试一:测试一的重点是测试几何和照明。在这个测试中,没有景深处理,粒子部分的分辨率减半,关闭了粒子光照系统。在整个测试中使用了100个阴影点光源、140个非阴影点光源。平均每一帧有390万个顶点,其中包含了50万个曲面细分顶点输入,光栅化三角形的数量达到510万个,像素数量达到了8000万个。特别值得一提的是,用于模拟粒子和后处理效果的ComputeShader在每帧中至少会使用150万次。
c.图形测试二:图形测试二重点是测试粒子和GPU模拟,开启了全分辨率的粒子以及粒子动态光照系统。GPU模拟方面生成了两个烟雾区域,需要计算6个阴影点光源和65个非阴影点光源。平均每帧需要计算260万个顶点(包含24万个曲面细分顶点输入)、140万个几何基元、总计580万个光栅化三角形以及1.7亿个像素。在ComputeShader部分,每帧使用810万次,用于粒子、流体和后期处理,后期处理包含景深效果。
d.物理测试:模拟场景看起来比较复杂,实际上从测试成绩来看不如Cloud Gate复杂。本项测试有32个模拟系统,每个CPU核心模拟一个线程。其余部分和Cloud Gate类似。
e.综合测试:综合了图形测试一、二中几乎所有的特效。GPU部分包含曲面细分、体积照明、流体模拟、粒子模拟、快速傅立叶变换泛光、景深等。CPU部分则模拟32个物理体系的刚体,每个体系中所包含的雕像会被分解为113份。此外,还有16个刚体推动分解,但是它们是看不到的。
f . 测试设置:包含了所有项目的设置,包括曲面细分等级和拆分系数等。在Performance设置中,曲面细分等级为中等、表面阴影采样为8个、使用1024分辨率的阴影贴图,体积照明、粒子照明、环境光遮蔽和景深的质量都设置为中等,泛光的分辨率为1/4。Extreme设置就要高很多了,曲面细分等级为高,表面阴影采样提高到16个,使用2048分辨率的阴影贴图,其余所有等级都是高,泛光分辨率保持了1/4不变。
g.测试引擎:新3DMark白皮书使用了很长的篇幅来描述其测试引擎部分所使用的技术。综合来看并没有太多新意,绝大部分内容都是对这些技术的解读和说明。根据白皮书的说明,新3DMark在DirectX 11部分使用了多线程、曲面细分、表面光照、体积光照、粒子光照、粒子变形、景深、透镜反射、泛光、抗锯齿(包含MSAA和FXAA)、烟雾模拟等技术。经常关注本刊的用户想必对这些技术并不陌生。
3.测试看点
Fire Strike场景才是新3DMark真正给用户带来的视觉盛宴。FireStrike中华丽的场景、飞溅的粒子和各种逼真的光特效令人震撼。除了光照效果和曲面细分带来了高精度细节外,对粒子的大量使用成为Fire Strike的重要特点。之前本刊曾多次介绍了几款当前的顶级游戏DEMO,并预言其中的粒子效果必将是未来游戏中重要的图形技术。而现在新3DMark大量使用粒子效果也从一个方面印证了本刊之前的推断。
主流显卡在新3DMark中的实际运行情况究竟如何?接下来,我们将进入新3DMark的测试部分,用测试来回答这些疑问。由于目前FutureMark暂时只推出了针对Windows系统的新3DMark版本,因此此次我们主要针对桌面级显卡进行测试。为了避免性能瓶颈,我们将组建使用了英特尔Core i7 3960X处理器的顶级平台进行测试。参测显卡为AMD Radeon HD 7000系列、NVIDIA GeForce GTX 600系列显卡,例如顶级的双核心产品Radeon HD 7990、GeForce GTX 690,以及定位主流市场的Radeon HD 7750、GeForce GT 640 2GB等。此外,相信很多用户也很关心整合平台在新3DMark中的表现,我们特意加入了一套由A8-5800K处理器、A75主板组建的整合平台,作为当下整合平台的代表参与本次测试。
为了给大家一个直观的印象,我们将在Ice Storm、Cloud Gate、FireStrike Performance、Fire Strike Extreme这四种场景下进行测试。不过前文已经提到,Fire Strike场景才是衡量桌面级显卡的佳标准,因此我们的测试分析将以Fire Strike Performance、Fire Strike Extreme这两个场景为主。
GeForce GTX 690、Radeon HD 7990目前分别是NVIDIA、AMD的旗舰级双核心产品,二者在新3DMark中又会碰出怎样的火花呢?
A卡领先N卡背后的秘密
每一代3DMark推出之际都伴随着无数的争议,原因很简单,无非是认为测试场景内容的设计不够公正,造成测试成绩偏向某一方或者测试场景无法代表实际游戏情况的结果。事实是否如此呢?这次新3DMark是否也遇到了这种情况呢?我们不妨从测试结果中找寻答案。
从测试来看,可以很明显地发现A卡在各种模式下的成绩普遍小幅领先同档次的N卡。而3DMark 11的测试结果却恰好与之相反,N卡的成绩则领先同档次的A卡。不难看出,相同的显卡却在两款不同的软件中呈现截然相反的测试结果,3DMark 11“偏N”,而新3DMark则更“偏A”一些。出现这样的结果并非FutureMark刻意针对AMD或者NVIDIA显卡进行了特别优化,而是3DMark 11和新3DMark在设计之初的设计理念就不同,这导致两者的测试场景、总分计算等不同,并终影响了测试结果。相信很多用户都对3DMark 11动辄就是高精度纹理的场景,仿佛一部电影大片的情形记忆犹新。没错,3DMark11力求塑造一种宽宏、精美的场景,因此测试内容加入了大量的高精度纹理内容,这是3DMark 11的一大特点。而GTX 680在GTX 580的基础上纹理单元数量翻倍,加上开普勒架构上的优势,一举在3DMark 11中获得性能优势也就不难理解了。
而新3DMa rk则不同,它并没有过分强调材质纹理的“暴力堆积”,而是加入了大量DirectX 11中的技术,如DirectCompute计算、较高等级的曲面细分等,还有各种光照、阴影、粒子效果计算,这要求显卡必须具备很高的计算能力。而在显存容量、单精度浮点运算能力、显存位宽、显存带宽等大量与显卡计算能力有关的规格上GTX680都不敌HD 7970。因此在新3DMark这种要求显卡拥有足够高的计算能力的测试软件上,采用规模比较小的芯片、以GTX 680为代表的开普勒显卡就开始显示出“先天不足”,难以和HD 7970这样规模比较大的芯片抗衡了。
总体来看,在本次参测显卡中只有GTX 690、HD 7990这两款顶级双核心显卡能够较为流畅运行在Fire Strike场景下,特别是Fire Strike Extreme场景。在Fire Strike Performance的FireStrikeGT1X、FireStrikeGT2X场景下,这两款显卡都保持了50fps左右的平均帧率。而在极度考验显卡性能的Fire Strike Extreme场景下,这两款显卡的平均帧率都跌落至25fps左右,基本保证了流畅性。
正如上文提到那样,采用GCN架构的HD 7000系列显卡由于规格出众,具备强大的力量计算性能,因此在新3DMark上的优势更为明显。HD 7970本身的规格就强于GTX 680,而采用两颗HD 7970核心的HD 7990的计算性能更是得到了长足的提升,在新3DMark中的优势较GTX 690非常明显。以为严苛的Fire Strike Extreme为例,HD 7990的性能领先GTX 690高达10%,将自身强大的计算性能发挥得淋漓尽致。10%的领先幅度已经是参测显卡中,同级别显卡中的大性能差距了。
不过值得注意的是,通过观察这两款双核心显卡以及它们各自对应的单核心显卡的帧率曲线可以发现,GTX 690、HD 7990的帧率曲线波动非常明显,尤其是HD 7990几乎每一个测试场景的曲线都呈“犬齿状”。而反观GTX 680、HD 7970的帧率曲线则相对平缓很多,这说明新3DMark对双核心显卡的优化目前还不到位。
GTX 690的新3DMark Fire Strike Performance详细测试结果,总分为9726。橙色曲线为显卡帧率曲线,纵坐标为帧率,横坐标为时间(以下同)。
GTX 690的新3DMark Fire Strike Extreme详细测试结果,总分为5059。
HD 7990的新3DMark Fire Strike Performance详细测试结果,总分为10858。
HD 7990的新3DMark Fire Strike Extreme详细测试结果,总分为5578。
总体来看,这两款显卡在新3DMark中的测试结果基本持平,HD 7970稍占优势。不过Fire Strike Extreme场景给显卡带来了极大的压力,这两款旗舰单核心显卡在图形测试部分的平均帧率也只有20fps左右。两者在FireStrike GT1X场景下的帧率曲线非常类似,高帧率都是21fps。而在Fire Strike GT2X场景下,HD 7970的高帧率虽然达到了22fps(GTX 680为19fps),但在第36秒~第45秒的场景下的帧率波动非常厉害。相反,GT X 68 0在这段场景中的帧率较为平滑,反而让人觉得画面会更流畅一些。在Fire StrikePe r f o r m a n c e模式下,由于负载降低,这两款显卡的平均帧率在30fps以上,高帧率都突破了40 f ps。在该模式下,这两款显卡的帧率曲线走势基本保持了一致,不过HD 7970在局部场景下的帧率曲线呈“犬齿状”,不够平滑和稳定。
GTX 680的新3DMark Fire Strike Performance详细测试结果,总分为6265。
GTX 680的新3DMark Fire Strike Extreme详细测试结果,总分为3071。
HD 7970的新3DMark Fire Strike Performance详细测试结果,总分为6512。
HD 7970的新3DMark Fire Strike Extreme详细测试结果,总分为3151。
相对于顶级显卡和低端显卡,游戏玩家的关注点多在中高端显卡上(GTX 660、HD 7850),即1500元级别的显卡。和高端显卡在新3DMa rk测试结果不同的是,在中高端显卡的测试上,N卡反超A卡,GTX 660的表现明显比HD 7850更好。究其原因,GTX 660和HD 7850在硬件上的规格差距已经很小了。双方同为2GB显存,虽然GTX 660的192bit显存位宽比HD7850的256bit要小一些,但是前者的频率更高。再加上GTX 660在架构上的优势,因此实际计算能力甚至比HD7850更强。1500元级别的显卡在运行Fire Strike场景时已经颇显吃力,即使在Performance模式下GTX 660、HD7850的平均帧率也只有2 0 f ps左右。此时在FireStr ikeGT2X场景下,HD7850的帧率曲线波动非常大,帧率上下起伏非常明显,能让人明显感觉到画面卡钝的感觉。而GTX 660的帧率曲线则比较正常,随着场景负载的高低而变化,并没有出现帧率不正常的情况。HD 7850帧率曲线波动大的情况还出现在后的综合测试中,它的帧率曲线一直呈现忽高忽低的状态。而GTX 660的表现则明显更好,帧率曲线几乎呈直线状态,非常稳定。
GTX 660的新3DMark Fire Strike Performance详细测试结果,总分为4356。
GTX 660的新3DMark Fire Strike Extreme详细测试结果,总分为2133。
HD 7850的新3DMark Fire Strike Performance详细测试结果,总分为4214。
HD 7850的新3DMark Fire Strike Extreme详细测试结果,总分为2033。
目前在售的主流中端显卡是千元级的GTX 650Ti、HD 7770,低端显卡则是700元级别的GTX 650、HD 7750,以及价格在600元左右的GT 640。在Fire Strike Performance模式下,这5款显卡的测试结果和本身的定位相吻合。但在Fire Strike Extreme模式下,GT 640的性能突然爆发,性能不仅超过了GTX 650,即使与GTX 650Ti相比也只有很小的差距—这究竟是什么原因呢?
事实上,Fire Strike Performance模式、Fire Strike Extreme模式有一个大的不同,那就是前者的分辨率为1920×1080,后者的分辨率却达到了2560×1440。很显然Fire Strike Extreme模式对显卡性能要求更高,尤其是对显存容量提出了更高的要求,因此1GB显存版本的显卡在该模式下性能会受到很大的影响。以定位更高、具备2GB显存容量的GTX 660、HD 7850为例,两者在Fire Strike Extreme模式下的成绩约为Fire Strike Extreme模式下的1/2左右,显存容量为1GB的HD 7770、HD7750、GTX 650Ti、GTX 650则分别只有1/3、1/3、1/4、1/4左右。
而参测的GT640无论是GPU本身的性能、定位、规格都不如另外4 款显卡,但它的显存容量却达到了2GB,能够满足高分辨率对显存容量的需求,因此它在Fire Strike Extreme模式下的成绩异军突起也就不难理解了。这也从一个侧面说明在某些情况下,当显卡的显存位宽一定的时候,且性能、定位相当或者差距不大的情况下,Fire Strike Extreme模式对显存容量更为敏感,其敏感的程度不仅超过了显存速度,甚至还超过了核心频率、流处理器数量等影响显卡性能的规格参数。
另一方面值得一提的是,这5款显卡的物理测试单项的分数和帧率都是一样的,而且与其他更高级别的显卡也保持一致。这进一步说明了新3DMark使用的是Bullet开源物理引擎,在进行物理运算时完全由CPU负责,GPU并不参与计算,因此只要所使用的处理器型号相同,那么终的物理测试单项的分数、帧率都是一样的。
作为目前集显平台的代表,A8-5800K集成的Radeon HD 7660D图形核心的游戏性能很不错,早已超越了500元及以下的独立显卡。当然,它在新3DMark面前依旧显得弱不禁风,测试成绩与绝大部分独立显卡相比仍然有不可跨越的差距。但它的成绩,尤其是在Fire Strike Extreme下成绩却耐人寻味——与GTX 650、HD7750这样的当下主流独立显卡的性能差距很小,而在实际游戏中,这两款独立显卡的性能会大幅超过Radeon HD 7660D。
要知道Radeon HD 7660D只有384个SPU、本身的显存容量也只有512MB,那么它为什么会有这样的表现呢?答案依旧是显存容量,A8-5800K集显平台在实际运行中可以调动内存作为显存使用,这在非常强调显存容量的Fire Strike Extreme测试中显得尤为重要,弥补了自身性能的不足,从而拉近了与独立显卡的差距。而其他场景则对显存容量没有那么敏感,A8-5800K集显平台的性能劣势开始显现。例如在Fire Strike Performance场景下,GTX 650的性能领先A8-5800K集显平台高达103%,而在Fire Strike Extreme场景下GTX 650的领先幅度只有21%。
GTX 650Ti的新3DMark Fire Strike Extreme详细测试结果,总分为704。
GTX 650的新3DMark Fire Strike Extreme详细测试结果,总分为531。
GT 640 2GB的新3DMark Fire Strike Extreme详细测试结果,总分为668。
HD 7770的新3DMark Fire Strike Extreme详细测试结果,总分为1083。
HD 7750的新3DMark Fire Strike Extreme详细测试结果,总分为771。
A8-5800K的新3DMark Fire Strike Performance详细测试结果,总分为963。
A8-5800K的新3DMark Fire Strike Extreme详细测试结果,总分为437。
测试小结: 测试软件和硬件真实性能的关系
测试软件的目的是考察硬件性能,为用户选择产品提供指导。早期的测试软件一般功能单一,测试成绩也比较隐晦,普通用户一时难以看懂。不过随着技术发展,当前的测试软件逐渐开始傻瓜化。比如运行软件后,点击一下“Test”,后就可以看到唯一的一个总分,直接比较总分高低就可以了。
这样真的够吗?以GPU为例,硬件设计越来越复杂,功能越来越多,可编程性特性的加入又让软件相对硬件的优化和使用成为了一个复杂的问题。在测试对象越来越复杂的情况下,测试软件的终成绩和分数却越来越简单,这显然是背道而驰的。
在3DMark的发展上这样的例子其实不少,近的例子就有3DMark 11。在3DMark11中,对DirectX 11本身的技术使用并不太多,特别是NVIDIA引以为傲的曲面细分,无论是细分等级还是曲面拆分系数都不高,反倒是在整个测试中大量使用了超高精度的纹理、再加上复杂的后处理效果。测试结果也对NVIDIA当时的产品不利,由于NVIDIA Fermi家族的纹理性能较差,因此在3DMark 11中很吃亏,甚至两款同级别的显卡在3DMark 11和某些游戏中的测试情况完全背道而驰。与此类似的是AMDHD 7000家族对阵NVIDIA GTX 600家族,GTX 600家族大幅度加强了纹理单元,因此在3DMark 11的测试中占尽了优势。
在新3DMark中,情况又发生了变化,GTX 680又以较明显的幅度输给了HD 7970。这是因为新3DMark测试较为均衡,使用的技术手段都比较“新潮”,比如大量的Direct Compute计算、较高等级的曲面细分、各种光照处理等。大量新技术加上高数据量、高计算量,GTX 680这样规模比较小的芯片就开始显示出“先天不足”,难以和HD 7970这样规模比较大的芯片抗衡了,因此终成绩又被HD 7970反超。
但这样的结果真的符合用户的期望吗?显然也不是,因为在实际游戏测试中,HD 7970还是和GTX 68 0杀了个难解难分,高分辨率下GTX 680具备优势,超高分辨率、高负载环境下HD 7970则强过一头。这样的结果和新3DMark测试存在较大差异。出,原因不外乎游戏和测试软件本身存在差异,不同的软件取向导致了不同的测试结果。不仅游戏和测试程序之间,实际上游戏和游戏之间也存在差异,从游戏开发角度来说,游戏开发人员在游戏编写过程中面临很多选择,比如纹理压缩格式用哪一种、抗锯齿模式选什么、光照计算方法选什么、后处理用哪种方法等各种各样的选择。而AMD和NVIDIA在很多细节技术格式支持上的差异,终又会造成游戏测试结果的千差万别。
综合来看,测试软件终究是测试软件,它很难也不可能代表所有的应用情况,测试软件只能代表自己——或者说好听一点代表未来,再好听一点是代表一段时间内主流游戏的发展情况。当然,你是一个普通用户,可以通过多款测试软件直观地了解到显卡的性能,这也无可厚非,但一定要记住:测试软件的性能只能作为参考,还必须考察显卡在游戏中的实际性能。
当然,我们并非否认新3DMark的意义,毕竟作为一款传承多年、早已深入人心的图形测试软件来说,新3DMark的作用是任何一款图形测试软件都无法替代的。即使你一点也不懂显卡也没关系,因为新3DMark的测试结果可以在短的时间内让你大致了解目前主流显卡的性能是怎样的,对于指导用户购买显卡有着非常重要的意义。
从测试来看,新3DMark才刚发布,对一些显卡的优化还不到位,例如双核心显卡在该软件中的帧率起伏非常明显,AMD显卡的测试分数虽然较高,但是帧率起伏较为明显,相信通过后期版本的更新以及驱动程序的优化,这些问题可以得到解决。而NVIDIA显卡的测试成绩虽然小幅落后AMD显卡,它的帧率曲线明显更平缓,显示出开普勒架构以及NVIDIA显卡驱动程序的优势。
新3DMark全面测试,Fire Strike Extreme场景得分
新3DMark全面测试,Fire Strike Performance场景得分
新3DMark全面测试,Cloud Gate场景得分
新3DMark全面测试,Ice Storm场景得分
就目前已经能够完整测试的PC部分而言,平心而论,新3DM a rk在技术支持和场景设计上已经很出色了,技术的使用比较中立,场景设计也充分考虑未来很长一段时间发展的需求。特别是在Fire Str ike的测试中,大量粒子、烟雾和光照效果的使用,为用户勾画了未来游戏应该有的画面,展示了FutureMark强悍的技术功底和对技术发展方向的把握。新3DMark的测试成绩也能比较好地反映出显卡本身硬件基准水平。
总的来看,本代3DMa rk无论在测试体系、技术还是场景设计上都做出了很多有益的尝试,代表了未来测试软件“大一统”的发展方向,值得赞赏。
新3DMark在Windows平台上对硬件的需求
仅从硬件需求来看,只要是Windows Vista以上的系统(必须安装DirectX 11)、支持DirectX 9以上的显卡(至少需要128MB的显存,支持WDDM 1.1的驱动和Shader Model 3.0的硬件规格,GeForce 7000系列由于有WDDM 1.1的驱动,因此可以运行3DMark,AMD方面由于Radeon HD 2000以后的显卡才有WDDM 1.1驱动,因此诸如Radeon X1000系列就不能运行3DMark了)、2GB以上内存、3GB的磁盘空间即可。
事实上,之前3DMark 11都必须要求DirectX 11显卡才能运行。而新3DMark对硬件的要求不但不离谱,反而还还低了不少。新3DMark在硬件要求上的降低和其设计理念以及整个测试软件的规划、支持都有关系,因为现在FutureMark已经不满足于3DMark仅支持Windows平台,它将目光投向了更远、更广阔的地方。
DirectX 11中的Direct3D Feature Level等级
我们知道DirectX实际上包含诸多内容,除了Direct3D外,还有DirectSound等内容。一般来说,影响显卡和图形部分的关键因素就是Direct3D,其余部分主要涉及音频、键盘、2D绘制等,和图形关系不大。因此,Direct3D实际上就代表了DirectX在图形部分的升级。从DirectX 9到现在,Direct3D重大升级的版本就有4个,分别对应DirectX 9.0,DirectX9.0c,DirectX 10,DirectX11,新3DMark是如何确保这些版本之间的兼容性呢?
在当前的DirectX中,微软确定了不同的Direct3D Feature Level。比如Direct3D Feature Level 9.1和Direct3D Feature Level9.3,前者支持ShaderModel 2.0,后者支持ShaderModel 3.0,分别来自于DirectX 9.0和DirectX 9.0c。此外还有Direct3D FeatureLevel 10,它指的是ShaderModel 4.0,来自于DirectX 10。而新的DirectX 11中的功能诸如曲面细分等,则包含在Direct3D FeatureLevel 11中,对应的是ShaderModel 5.0和DirectX 11。Direct3D Feature Level只能向兼容,不能向上兼容。从另一个角度来看,如果用不太严谨的语言描述,用户可以认为“老版本的Direct3D总是会自动成为新版本Direct3D的子集”。
打比方来说,如果一张显卡支持Direct3D Feature Level 11,那么就包含了从早的DirectX一直到目前新的DirectX 11中的所有功能。反过来说,如果将高支持DirectX 9.0c的GeForce 7900 GT X安装在Windows 7中,在DirectX检测部分会显示目前支持的是DirectX 11。不过这仅仅是DirectX方面的支持而已—系统确实在软件上支持DirectX 11(别忘了DirectX 11不仅仅是3D部分),但具体到Direct3D时,只能支持到显卡所能支持的Direct3D Feature level 9.3,即只能支持9.3等级所规定的效果,更高的Direct3D Feature level 10.0乃至11是不支持的(可以简单认为DirectX 9.0c已经成为DirectX 11的子集)。
对程序员来说,Direct3D Feature Level的意义在于,使用Direct3D编写程序时,只需要调用不同的Direct3D Feature Level就可以写出兼容不同档次显卡的程序,而不需要专门为DirectX 9.0、DirectX 10等发布多个版本。同时还可以使用到DirectX 11所提供的其他新功能,这样无论是编程还是系统兼容性方面,都显得简单易用了很多。
新3DMark的分数计算方法
在新3DMark的每一个场景对应的测试中,终会得到三个或者四个测试数据,分别是Fgt1、Fgt2这两个图形测试成绩,以及Fphysics物理测试成绩和Fcombined综合测试成绩(只有Fire Strike场景才有)。这三个测试成绩分别由每个场景对应的相关测试给出,原始数据主要来自平均帧统计。在得到原始数据后,根据不同场景,新3DMark会使用独特的算法终计算出每个场景的测试分数。
在上述公式中,S3DMark是指后的场景总分。W是每个场景在测试中不同部分所占的比例,W值是固定的。在Ice Strom和Cloud Gate场景中,Wgraphics和Wp hyics分别是7/9和2/9(由于前两个测试没有综合测试,因此没有Wcombined)。在Fire Strike场景中,Wgraphics、Wphyics和Wcombined分别是0.75,0.15和0.10。
S分有三项,分别是Sgraphics 、Sphysics和Scombined,其中Cgraphics是常数,值为230。
在Sphysics的计算公式中,Cphysics也是常数,值为315。
Scombined只有Fire Strike才有,Ccombined是常数,值为215。
在这些数值都清楚后,就可以通过上述公式计算新3DMark的总分了。比如某显卡在Fire Strike场景测试中,四个测试得分为Fg t1=29. 5,Fg t2=22.8,Fphysics=28.3和Fcombined=7.7,那么根据上述算法:
Sgraphics=230×2/(1/29.5+1/22.8)=5915.8
Sphysics=315×28.3=8914.5
Scombined=215×7.7=1655.5
S3DMark=(0.75+0.15+0.10)/(0.75/5915.8+0.15/8914.
5+0.10/1655.5)=4901
4901就是某显卡在Fire Strike场景下的测试得分。