MCPLive > 杂志文章 > NVIDIA显卡超频入门

NVIDIA显卡超频入门

2009-12-11但蒙《微型计算机》2009年11月下

一直以来,显卡都只有两个主要组成部分:GPU和显存,它们分别以两种频率工作,相互配合终将图像素材处理成丰富多彩的动态3D画面。而进入
DirectX 10时代后,GPU的设计有了很大不同,NVIDIA的产品更是出现了三种频率,它们是如何发挥作用的?又如何进行恰当的调节发挥出更高的性能呢?

三种频率从何而来?

对于那些初涉DIY硬件的玩家,首先当然要搞清楚CPU、主板、显卡等配件是什么、如何发挥功能。之后,如果还想进一步摆弄自己的硬件,几乎所有玩家都会尝试超频。其中CPU的超频很好理解,提升外频或者倍频后,处理器的工作速度自然会加快。但如果你有一块NVIDIA的DirectX 10显卡,它的频率调节可就不那么单纯了。


GeForce 9500GT的频率设定界面

安装NVIDIA System tools软件后,NVIDIA的显卡控制中心会多出超频项目,其中有三个频率调节滑块,分别是核心时钟、内存时钟和着色器时钟。毫无疑问,将它们的频率调高后显卡的性能也会提升,但许多不想调得不明不白的玩家可能会产生疑问:这三个频率调节滑块分别控制着显卡的哪个部分?它们又是如何影响显卡工作的?要回答这些问题,还得从显卡如何生成3D图像说起。

着色器(流处理器)的作用是什么?

简单点说,显卡生成3D图像的过程就相当于用三根棍子围成一个三角框,然后剪一张形状相等的纸粘在框上,后在纸框上画上想要的图案。如果想要一个正四面体,可拿四个等边三角形纸框拼起来,如果想要一个正方体,可做12个等腰直角三角形拼起来。例如显卡要绘制出下图中的3D正立方体,首先它需要计算出正立方体8个顶点的空间坐标,然后把顶点每3个一组连接起来生成面,后再把“DirectX”图像贴在面上,并计算出不同角度表现出的光照亮度等视觉效果就完成了。在
GPU中,这三个步骤依次由顶点着色器,几何着色器和像素着色器来负责,它们也是GPU中为重要,处理负荷重的单元。但这种设计会带来一个问题:有些游戏的几何处理任务更重,而有的游戏像素处理任务更重,这就会造成某类着色器空闲,而某类着色器又不够用的情况。


正立方体的结构

为了解决上述问题,新的DirectX 10显卡的着色器架构被重新设计,取而代之的是流处理器(或称统一着色器)—它能同时完成顶点、几何和像素处理任务,可根据任务的比重变化调整分配给不同任务的流处理器数量,这样就充分利用了流处理器资源,让游戏性能佳化。相对于AMD显卡,NVIDIA的设计则更加巧妙,它把流处理器频率从GPU频率中独立出来,让其工作在一个更高的频率下。前文已提到,顶点、几何和像素处理任务是为繁重的,让负责处理它们的流处理器工作在更高的频率下显然能提升显卡的性能,如果进一步进行超频,GPU生成3D图形的速度自然就会加快,对性能的提升非常有意义。

核心(GPU)的组成和功能是什么?

这里谈到的GPU除了流处理器,为重要的部分是ROP、RAMDAC和控制器,前两者的作用仍旧是图像处理,后者是GPU中的指挥中心,显卡各单元都归它管理,协调数据的输入输出,接受并执行来自CPU的命令等。

ROP的中文全称是“光栅操作单元”, GeForce 9500 GT显卡的光栅操作单元有8个ROPs,而GeForce GTX 285这样的高端显卡则有32个。它的工作紧接在流处理器之后,负责将流处理器完成的3D图形数据转换为图像,并进行后期加工。


GeForce GTX 275显卡的物理结构(RAMDAC被独立出来)

流处理器处理完的数据都是诸如空间中哪个坐标处有一个形状是怎样的图形,全都是用数学来描述的数据。例如数学老师让学生在纸上画一个6cm×4cm的红色长方形,学生按照老师的描述画出边并涂上颜色,我们才能真正知道这个长方形看起来是什么样子。其中老师就相当于流处理器,而学生就相当于ROP。如果这个学生不太聪明,画的速度很慢,那老师必须等他画完才能给他出下一道题,显卡也是一个道理。更何况ROP还负责全屏抗锯齿(AA)的处理,如果GPU的频率不高,那么玩游戏时开启AA肯定不会流畅。

RAMDAC的中文全称是“随机数模转换记忆体”,它的工作接在光栅操作单元之后,负责把终图像转换为显示器能够识别的视频信号,比如DVI信号。在NVIDIA的高端显卡中,RAMDAC已从GPU中独立出来,用一枚靠近视频接口的NVIO芯片负责。它的频率也是独立的,比如400MHz,但这个频率高低和游戏性能毫无关系,400MHz已经能足够好地完成任务,没有必要对其进行超频。

内存(显存)是如何发挥作用的?

要知道显存的作用,我们首先用下图总结一下GPU的处理流程:

来自CPU的原始图像素材,比如材质、贴图等通过GPU被送到显存,等待进行加工。CPU会给GPU发送指令,告诉它如何加工。加工的第一步由GPU内的流处理器完成,它们从显存内读取原始素材,按照顶点、几何和像素的顺序依次进行处理,之后把处理结果再存储到显存中。到加工的第二步,GPU内部的ROP会从显存中读取前一步的成果,进行光栅化,终图像存入显存的RAMDAC区域,RAMDAC从显存的这个区域读取图像,并转换为显示器能够识别的视频信号。


显卡工作流程,GPU和显存之间会不断地交换数据

从流程图可以清楚地看到,无论GPU在哪个步骤,都需要和显存进行数据交换,如果交换速度缓慢,某个步骤就会处于等待状态,这样将严重影响游戏性能。因此,不论是选择显卡,还是对显卡进行超频,我们都不能忽视显存的地位。

三种频率,三种“脾气”

如果某位玩家想把这三个频率提升到极限,它就会遇到一个问题:不论GPU、流处理器或显存,只要其中一者工作不稳定,整个超频就会失败,比仅有GPU和显存两种频率的显卡更难把控。假设流处理器因为频率过高导致显卡不稳定,这时GPU和显存的频率也许还可以进一步提升,但如何得知到底哪个超高了,哪个又可以继续往上超呢?不用担心,这其中还是有一些制胜诀窍的。

前文已谈到,GPU中除了含有图像处理单元,还有大量的控制单元。如果把GPU的频率超高了,运行FurMark这款GPU测试软件时这些控制单元会不稳定,显卡的工作就会全乱套,和CPU沟通也会出现问题,这时的结果就是画面卡死、黑屏,也就是显卡导致的死机,因此我们可用是否死机来评判GPU频率是否达到极限。


流处理器不稳定导致了明显的图像劣化

流处理器如果发生不稳定,也有办法可以得知。在FurMark软件的截图中,我们能清楚地看到一块GeForce 9500 GT显卡流处理器不稳定所造成的现象:画面中会不定时闪过疏状的杂像。因为流处理器中不含控制单元,即使计算结果错误,GPU也不会知道正误与否,照样把错误的结果输出,并不会造成死机问题。

显存是一个完全独立于GPU的部件,但它存储了供GPU计算的图像原料和GPU处理过程中产生的中间数据,如果它发生不稳定,这些数据就会出错。如图所示,在显存初步表现出不稳定现象时,FurMark上会闪现一些黑点。


显存不稳定时可看到肉环上的黑色噪点

了解到各频率是否达到极限的辨认方法后,我们也不能忽视了频率的调节顺序。其中显存是独立的部件,我们可以首先把它的频率提升到极限。但GPU和流处理器就不同,如果先把GPU频率提升到极限,再超流处理器,可能在流处理器未达到极限频率时系统就死机了。因为超频流处理器会带来更多的发热,本能够稳定工作的GPU在高热量下可能就会出问题。所以我们应先超流处理器,再超GPU,即使GPU频率提升导致的发热令流处理器不稳定,系统也不会死机,这时稍微降低一下流处理器频率就行了。

分享到:

用户评论

共有评论(3)

用户名:

密码: