MCPLive > 杂志文章 > 首款Cortex-A15架构处理器解析

首款Cortex-A15架构处理器解析

2012-10-16张泉《微型计算机》2012年9月下

移动计算的发展速度几乎超出了所有人的预期,在单核、双核过去后,四核心潮流又涌动而来。虽然相比核心数量,核心架构的关注度要低一些,但它的重要性和进化幅度一点也不逊色。从早期的Cortex–A8,到目前主流的Cortex-A9,再到前不久三星发布的全球首款Cortex-A15架构处理器Exynos 5,核心架构的改进一直在稳步向前。那么,架构变化是怎样影响CPU性能的?Cortex-A15架构的处理器又有哪些优势呢?

全球CPU厂商中,x86架构代表厂商是英特尔和AMD,它们在个人电脑业务上呼风唤雨,影响着几乎所有用户的使用体验。相比之下,ARM就要低调很多。ARM本身不生CPU,只提供设计和技术授权。厂商通过购买ARM的技术授权来自行生产产品。ARM产品以极高的性能功耗比著称,在手机、平板等移动手持设备市场占据着绝对优势。

现在比较主流的手机和平板使用的ARM处理器往往基于ARM v7指令集,基于这个指令集的产品多采用Cortex-A8、Cortex-A9以及一些厂商自行修改的架构(比如高通)。在新的架构出现之前,厂商在Cortex-A9以及Cortex-A8上的发展主要是依靠提升制程、频率和核心数量。这些做法往往可能造成芯片面积过大、发热量较大等问题。因此,在进一步提升制程的同时,采用全新的核心架构来保证CPU性能的继续发展,就显得相当必要了。

ARM及其合作伙伴在去年就公布了ARM v7指令集的新一代架构Cortex-A15的部分信息。不过由于Cortex-A15的复杂性以及新工艺的导入等问题,Cortex-A15在很长一段时间内除了路线图之类的纸面信息外,没有任何实际产品的消息,在各大展会上也只是惊鸿一瞥。而2012年8月10日,三星发布了自家Cortex-A15架构的首款产品Exynos 5,Cortex-A15架构终于正式走向前台。

首款A15——三星Exynos 5处理器登场

Exynos 5处理器有双核和四核两个版本,首批发布的型号为双核版本Exynos 5 Dual。目前已知的参数有:采用32nm HKMG(High-K绝缘层+金属栅极)工艺制造,属于32bit-RISC架构的SOC片上系统处理器。Exynos 5 Dual拥有两个Cortex-A15核心,高主频1.7GHz,每个核心拥有独立64KB L1缓存(共计128KB)和共有1MB L2缓存。内存部分,新的处理器可以支持双通道LPDDR3/DDR3 800MHz,大带宽可以达到12.8GB/s。这样的带宽可以应付高分辨率下桌面刷新、3D游戏、高清视频解码等应用需要。

在很多用户比较关注的图形处理部分,Exynos 5采用的是来自于ARM原生Mali-T604。这颗GPU的API可以支持DirectX 11(GPU功能只支持到Direct3D featurelevel 9.3)和OpenCL 1.1,因此可以支持GPGPU计算。三星官方宣称Exynos 5 Dual的图形性能至少是上代Exynos 4的两倍。

Exynos 5体系架构图,可以看到Exynos 5支持的几乎所有功能和接口方案。
Exynos 5体系架构图,可以看到Exynos 5支持的几乎所有功能和接口方案。

三星认为支持超高分辨率需要更强大的内存带宽,2560×1600至少需要8GB/s的带宽。
三星认为支持超高分辨率需要更强大的内存带宽,2560×1600至少需要8GB/s的带宽。

Cortex-A9架构简图,只标注了重要的功能性部件
Cortex-A9架构简图,只标注了重要的功能性部件

Cortex-A15架构简图,同样只标注了重要的功能性部件。
Cortex-A15架构简图,同样只标注了重要的功能性部件。

ARM公布的四核心Cortex-A15结构图
ARM公布的四核心Cortex-A15结构图

由于图形性能强大,三星给出了令人惊叹的大分辨率支持:2560×1600,这已经赶上了苹果在新 iPad上采用的视网膜屏的水准。在视频编解码方面,这颗处理器内置的视频编码单元可以支持1080p分辨率下60fps的高清视频编码。其余的特色功能还有支持面板自刷新(可以节约不少能源),并支持HDMI 1.4输出。在信号传输和连接方面,Exynos 5 Dual支持USB 3.0、SATA 3.0以及eMMC4.5(本地存储设备解决方案,可以更好地兼容各类NAND Flash芯片)等规范,能为厂商减少添加额外芯片的成本。

提高40%——Cortex-A15架构的优势

Cortex-A9架构设计高效而精简。典型的Cortex-A9架构每个核心配置了两个解码引擎,每个时钟周期可以执行两条解码命令。浮点单元配置方面,Cortex-A9架构搭配了一个VFPv3浮点引擎和一个NEON多媒体指令引擎。整数单元配置上,两个ALU单元、一个地址单元和一个乘法单元,组成了Cortex-A9的整数计算模块。缓存配置方面是32KB L1指令缓存和32KB L1追踪缓存,以及1MB L2缓存。

那么Cortex-A15的变化在哪里呢?从这张简略的Cortex-A15核心架构图上来看,典型的Cortex-A15架构每个核心的指令解码单元增加了一个,达到了3个,这样每周期可以处理三条指令,指令解码效能理论上比Cor tex-A9提升了33%。在浮点计算性能方面,Cortex-A15使用了两个VFP v4引擎和两个NEON引擎,相比前代Cortex-A9的VFP v3引擎而言,VFP v4支持IEEE 754浮点规范,性能大约提升一倍。整数方面,Cortex-A15拥有两个地址引擎,虽然在ALU和MUL配置方面和Cortex-A9相当,但是整体性能也要提升不少。Cortex-A15的缓存设计没有太大变化,不过借由内部架构的加强,Cortex-A15轻松胜出Cortex-A9基本上是毫无疑问的。

ARM公布的Mali-T604架构图,内部用虚线勾画的“着色器内核”是可选配置(也就是传说中的“单核心”到“四核心”)。
ARM公布的Mali-T604架构图,内部用虚线勾画的“着色器内核”是可选配置(也就是传说中的“单核心”到“四核心”)。

高通移动处理器发展路线图
高通移动处理器发展路线图

三星公布的Exynos 5的3D性能对比图,Exynos 5大约可以达到上代Exynos 4的两倍。
三星公布的Exynos 5的3D性能对比图,Exynos 5大约可以达到上代Exynos 4的两倍。

德州仪器OMAP 5内部架构图。德州仪器之前展示过多次OMAP 5产品,性能的确很出色,但是何时上市还没有任何消息。
德州仪器OMAP 5内部架构图。德州仪器之前展示过多次OMAP 5产品,性能的确很出色,但是何时上市还没有任何消息。

除了硬件内部架构设计上的差异外,Cortex-A15在一些重要的参数,比如数据指令宽度和指令分发能力上也得到了重大提升。Cortex-A15的指令宽度从Cortex-A9的64bit大幅度提升到128bit,指令分派方面可以支持8条指令分派,相比之下Cortex-A9只能支持4条。指令效率方面,由于Cortex-A9的分派端口比较少,可能出现浮点指令拥堵的情况,但Cortex-A15为VFP和NEON单元分别设置了指令分派单元,因此这方面的效率也会有比较明显的提高。此外,Cortex-A15的缓存设计也更为先进,Cortex-A15的二级缓存和核心紧密耦合,之前的核心私有缓存设计不复存在,取而代之的是更为优秀、效率更高的多核心共享缓存设计。根据A R M提供的官方参考资料,Cortex-A9的性能大约是2.5DMIPS/MHz,同频率下Cortex-A15可以达到3.5DMIPS/MHz,大约提升了40%。

新的GPU——Mali-T604

三星不像NVIDIA和高通那样拥有自有品牌的GPU支持,因此在GPU上一直紧跟ARM官方标准。之前的Exynos 4上三星使用了Mali-400系列GPU,早期由于Mali-400系列使用的厂商不多,游戏优化也不是很到位,部分游戏曾经出现过兼容性问题。但随着三星手机以及Exynos处理器使用逐渐广泛,这样的情况得到了很大改善。

新的Exynos 5系列使用的Mali-T604性能相比前代的性能号称大可提升至5倍,至少也可以达到2倍。性能上的提升离不开架构的更改和升级,和上代Mali-400配置的顶点、像素分开渲染的方式不同的是,Mali-T604已经统一渲染化,采用了统一渲染管线来同时处理顶点和像素计算。在统一的内核间任务管理器(类似桌面GPU的超线程分发设备,用于将工作务和计算负载分发给所有的流处理器,不过移动设备的流处理器数量较少,只需要简单的任务管理分发即可)的调配下,Mali-T604少可以配置一个着色器内核,多可以配置四个。目前没有很详细的数据说明Mali-T604在什么情况下、采用什么频率时的性能具体数值,但从官方宣传来看,Mali-T604的性能还是相当值得期待的。

值得关注的是,Mali-T604终于可以支持FSAA全屏幕抗锯齿了。在Mali-T604之前的移动GPU绝大部分都由于性能和功能设计等问题无法支持全屏幕抗锯齿,因此画面表现总是锯齿感严重,非常影响用户体验和玩家感受。Mali-T604支持4倍FSAA和大16倍FSAA(官方推荐使用4倍,这样不会带来太严重的性能损失),因此有能力带来更平滑真实的画面。三星和ARM目前都没有说明自己支持的FSAA采用怎样的算法,一般来看应该会使用MSAA来实现抗锯齿效果。不过目前后处理抗锯齿如FXAA等发展速度很快,资源耗费也很低,未来很有可能出现支持后处理抗锯齿的移动GPU。

其他方面,Mali-T604支持OpenGL ES 1.1&2.0&3.0、OpenVG 1.1和OpenCL 1.1,可以执行DirectX 11 API,但Direct3D依旧只可以支持到Direct3D feature level 9.3。其实对于移动设备的嵌入式GPU来说,支持DirectX 11的高级功能不但目前没有必要,并且耗费晶体管过多,还不如加强基础的三角形填充率和像素填充率等数据。至少后者可以使得开发人员使用更多、更精细的图形,视觉感受更为优秀。

三星Exynos 5的敌人们

三星Exynos 5系列处理器虽然早发布,但目前并没有实际产品销售,并且首批产品只能用于高性能平板设备。和之前Exynos 4系列不同的是,三星希望借Exynos 5提早发布上市的先机,在即将到来的Cortex-A15市场上建立领先者地位,以获得更多厂商和消费者的亲睐。但先来的不一定会笑到后,三星目前要面临的敌人也非常多。下面就一起来看看还有哪些厂商可能对三星Exynos 5产生实质性的威胁:

高通

高通虽然没有采用ARM的原生架构,但是自己研发的Krait架构在Cortex-A9上加入了不少Cortex-A15的特性,研发时间和研发速度都令人侧目。况且高通的新一代产品的上市时间更早,已经成为“后A9”时代第一款在市场上可以购买到的产品。再加上高通拥有的强大的基带搭配,不出意外的话,高通利用“A9+”核心会再次占据大部分ARM处理器市场。

德州仪器

德州仪器基于Cortex-A15架构的OMAP 5系列也在相当早的时候就公布了参数和设计等内容,甚至已经展示过一些性能参数和产品实际运行情况。不过直到现在,德州仪器新的OMAP 5产品的上市时间还尚未确定,乐观的估计也要在明年年初才可能看到产品(德州仪器表示至少会在CES 2013上看到实际产品)。从架构角度来看,德州仪器的CPU部分也是直接使用  ARM原厂设计方案,GPU部分则采用了PowerVR SGX 5系列,兼容性表现会相对出色一些。

NVIDIA

NVIDIA夺取了第一个双核心ARM移动处理器和第一个四核心ARM移动处理器的桂冠,并且凭借不错的性能和较为适宜的价格也占据了一部分ARM处理器的市场份额。一些非官方资料表明,NVIDIA的下一代产品被称作Tegra 4,依旧使用四个高性能核心原生Cortex-A15核心搭配一个低频率、低功耗伴核设计,采用TSMC 28nm HPL工艺,频率从1.2GHz到2.0GHz不等。GPU方面应该会使用24个核心的统一流处理器GPU,也同样可以支持DirectX 11以及OpenGL等规范。相关产品的具体上市时间,可能会在2012年底,目前看来还有希望抢到第一个四核心Cortex-A15处理器的名头。

意法爱立信

意法爱立信目前也在计划推出28nm的Cortex-A15架构的处理器,其GPU可能会采用PowerVR 6系列。意法爱立信的产品目前应用比较少,在索尼的部分手机以及一些注重性价比路线的产品上曝光率比较高。不过限制意法爱立信Cortex-A15产品的因素依旧是上市时间,暂时还看不到这方面的具体消息。

Cortex-A15,离我们还有点远

从技术角度来看,Cortex-A15架构本身相当不错,如果频率和功耗问题能够得到有效解决,其性能表现应该可以比拼几年前的低端笔记本电脑处理器,英特尔如果想再次进入移动计算市场,光靠一个单核心、低电压版本的Atom处理器获得优势的可能性不大。另外,从Exynos 5 Dual处理器以及其他厂商的研发情况来看,Cortex-A15架构还需要解决包括功耗控制在内的一些问题,其实际产品(高通除外)真正大规模上市(特别是手机),可能还需要等待一年左右的时间。在这么长的等待时间中,市场上主流产品依旧会以Cortex-A9架构为主,由于没有新的技术刺激点,因此未来一年手机市场价格大战可能会成为主流。Cortex-A15,目前看似离我们有点远,但对于日新月异的手机市场而言,这一切又有谁能说得准呢?

Cortex-A15的隐忧

虽然性能提升非常明显, 但Cortex-A15所遇到的问题也比较头疼—功耗难以控制。Cortex-A15相对Cortex-A9的性能增长不是没有来由的,增加的内部单元和更强的性能都需要更多的晶体管才可以完成。目前ARM CPU的主流工艺集中在40nm,使用40nm工艺制造的Cortex-A15核心即使频率不高,增加的大量晶体管也会带来更大的功耗。TSMC的28nm是多家厂商的主要选择,但直到目前,也没有任何TSMC28nm Cortex-A15产品的消息。

作为半导体制造大厂的三星,拥有自己的晶圆厂以及相对较高的32nm HKMG工艺,因此能够率先推出基于Cortex-A15架构的Exynos 5 Dual处理器。但即便如此,Exynos 5 Dual处理器的频率也从初传言的2GHz降到1.7GHz,并且使用范围也暂时限定在高端平板而不是手机上。

总的来看,短期内实现Cortex-A15双核心产品入驻手机等小体积产品还存在一定困难,在今年年底之前手机产品有Cortex-A15核心的产品上市已经很不容易了。市场在相当长一段时间内依旧会以双核和四核Cortex-A9为主打。

分享到:

用户评论

用户名:

密码: