MCPLive > 杂志文章 > 三星14nm Exynos 7420深入解读

三星14nm Exynos 7420深入解读

2015-10-28李张三四《微型计算机》2015年10月下

总的来看,三星14nm工艺是相当出色的,它的功耗和芯片面积表现都相当完美,并且比自己的老对手TSMC快了大概6到9个月,这几乎足以确定三定在晶体管工艺上的优势了。不过,TSMC也将很快推出自己的16nm FinFET制程,虽然数字看起来要比14nm大一点,但整体表现应该在伯仲之间。Exynos 7420在工艺上的进步,为其极高的性能功耗比和强悍的性能打下了坚实的基础。

Exynos 7420处理器内部解析

由于种种原因,厂商们并不愿意公开自己的处理器内部结构信息,往往只是给出一些用于市场运作的简略宣传图片。比如简单的画出一些方格子的图片,然后给出各个部分的名字。仅此而已。在Exynos 7420上,三星没有给出更多可靠的信息。因此本文下面所描述的内容都是基于产品本身进行合理推测而来。有可能和终三星公布的产品存在一定的差距(如果他们真的公布的话)。

图5是Exynos 7420的内部逻辑结构图。这张图片中,CPU核心、内存控制器等重要部件应该就是这些模块实际存在的大小和位置,但是有关ISP、以及图片右上角一大块功能模块区域的内容,由于三星没有更多资料,并且也特别复杂,因此只能简化为一个方框来表示。下面我们对这个处理器的逻辑结构做出一些解读。

Exynos 7420的内部逻辑结构简图
Exynos 7420的内部逻辑结构简图

首先来看GPU部分。如果光看芯片面积的话,Exynos 7420是一款面积非常小的处理器,它的核心面积只有78平方毫米,而其中大的一部分是来自于八个核心的Mali-T760 GPU,17.7mm的GPU占据了高达22.6%的面积,接近四分之一,所有八个GPU核心都通过总线连接起来,并且和GPU的L2缓存相连。三星之前宣称Exynos 5433的GPU部分L2缓存为512KB,相比之下,在考虑制程因素和更多的计算模块的因素后,Exynos 7420的GPU部分的面积还是比前代产品大很多,因此在缓存上可能有重大改变,据悉Exynos 7420的缓存相比前代产品容量可能翻倍至每个MMU拥有512KB,总计1MB。更大的缓存有助于提高提升命中率,降低频繁从内存总线调用数据的麻烦,还能进一步提升性能并加强处理器的能耗比,是非常正确的选择。

接下来是处理器部分。如图8所示,Exynos 7420的处理器和GPU部分其实距离相对比较远,CPU部分基本都在左上角顶格,而GPU部分则几乎都在右下角。三星解释说,这样放置的优势在于将主要的发热部分尽量远离,这对处理器终的散热和温度控制都有好处。Exynos 7420的Cortex-A53和Cortex-A57核心倒是离得远,两者采用ARM高速缓存一致性CCI-400总线相连。这个总线是ARM在big.LITTLE架构的核心技术,它允许不同规模、架构的处理器相连接。

在处理器的总线连接上,有一个有趣的内容值得一提。处理器的通过总线和名为G2D的模块相连。G2D模块的全称是Fully Integrated Mobile Graphics 2D,也就是全集成移动2D图形模块。这个部分作为Exynos 7420专用的系统级2D加速部分,主要执行2D显示、图像处理等内容。G2D模块又作为一个被称为MSCL的模块的一部分而存在,MSCL全称尚不清楚,不过从实现功能来看,这部分主要是专门固定功能硬件模块,比如JPEG的解压缩单元、图像分辨率重置模块(re-scaled)(主要用于重新调整视频或者图像分辨率,以更好的适合屏幕分辨率)等,是整个处理器显示功能实现的“大本营”。

接下来要介绍的部分是一个新的模块,这个模块在之前的移动处理器上非常罕见。Exynos 7420上,这部分被称为“内存压缩器”或者“M-Comp”。因为Android 4.4以后引入了内存压缩机制,大部分厂商都默认使用ZRAM机制来实现内存压缩,这次Exynos 7420引入了被称为“ZSWAP”的硬件压缩模块和整套方案,可将能够压缩的页面在被交换至目的设备之前就预先压缩。举例来说,比如在多任务运行时,数据压缩就显得非常重要,实测显示这个机制可以将1.21GB的页面压缩至341MB,再存储在内存中,大大提高了效率,并带来了处理器能耗比的显著提升。
在处理器内部的总线部分。在Exynos 7420上,GPU使用了两个CCI端口,每个CCI端口都是128bit位宽。一般来说,CCI总线的频率往往都是DRAM内存的一半。比如之前LG的Nuclun处理器,有两个CCI端口,总线频率为400MHz,内存控制器频率为800MHz。对GPU来说,如果只有一个CCI端口的话,那么考虑到两个32bit的内存控制器占用后,GPU带宽就剩下一半了,带宽严重不足会极大的影响GPU效率。因此,三星在GPU上设计了两个CCI端口。不仅如此,Exynos 7420的CCI总线频率也提升到了533MHz,恰好是内存总线1066MHz的一半。这样算下来,每个CCI端口带宽为8.5GB/s,两个就是17GB/s,这一点在后文的测试中会有详细验证。

目前对移动处理器而言,多媒体解码能力显得非常重要。在Exynos 7420上,三星实现了多格式编解码器的强大功能。这个编码器能够完成对MPEG4、H.263、H.264、VP8以及HEVC视频的编码和解码功能,并且还加入了对MPEG2、VC1、VP9的解码功能。基本上可以满足绝大部分用户需求了。另外,Exynos 7420的编解码器不但功能强大,在功耗表现上也很令人满意。根据三星数据,在播放4K、30Hz、HEVC编码的影片时,整个手机在低亮度、肖像模式等设置下的功耗仅为950mW,除去显示屏幕的话,系统部分的供电负载仅为600mW左右。CPU的负载非常低,只启用了两个Cortex-A53内核,频率为400MHz,负载为20%~30%,表现极为优秀。不过,Exynos 7420不能播放10bit视频,4K@60Hz的影片播放上存在卡顿等问题,因此考虑未来的话,Exynos 7420可能还需要进一步改进。

分享到:

用户评论

用户名:

密码: