RK3288 Cortex-A17芯片

2016年06月01日 11:37:33来源：深圳市九鼎创展科技有限公司

跑分王：Cortex-A17芯片

瑞芯微RK3288处理器采用Cortex-A17，其zui大的特点就是

与Cortex-A15一样采用*乱序执行架构，其性能提升有着*的效果。双指令译码、双地址产生器(AGU)、多指令派发(multi issue)等特别架构的设计，使得Cortex-A17在指令执行效率上有相当大的提升，正是基于以上改进，在同样的频率下，Cortex-A17的单线程性能要比Cortex-A9有40%的提升，而频率高达1.8GHz的RK3288性能较上一代RK3188有50%的性能提升。

游戏王：Mali-T764系列GPU的芯片

在之前RK3188处理器中，瑞芯微使用的GPU Mali-400一直是RK3188的

软肋。而在的RK3288处理器中，GPU采用Mali T76X系列GPU，Mali T764核心zui大特点是采用第三代Midgard架构，相比于T62x/65x系列GPU所采用的第二代MIDgard架构，第三代Midgard架构在内部架构上进行了重新设计，特别是大幅度改变了着色器核心的配置方式；着色器数量高达4个着色器核心，是之前的T654的两倍；2400M/s的像素填充率和300M/s的三角形生成率相对于过去获得了成倍的提升。

超清王：支持4Kx2K 实时硬解H.265、HDMI2.0

瑞芯微RK3288是支持4Kx2K，以及硬解H.265视频的芯片，带给用户清

晰的视觉享受作为更有效率的高清压缩格式，H.265标准已经成为了各视频的救命稻草。与H.264相比，H.265使用了大小浮动的编码单位以及更*的帧内预知模式，同画质的情况下使用H.265的视频可比H.264节省一半的带宽。瑞芯微RK3288是业界支持4K H.265实时硬件解码的ARM内核芯片，在视频的支持上发挥了其以往的音视频领域的积累优势，真正支持4K视频的输出及播放。[1]

RK3288GPU：Mali -T764详解

第三代midgard架构，火力更足

mali-t764zui大特色就是采用第三代midgard架构，在内部架构上进行了重新设计，大幅度改变了着色器核心的配置方式。着色器间的内存同步以及核心群间的scu依然保持。不过核心群间依然采用

独立的l2 缓存和snoop单元，彼此之间的通过amba4总线实现，因此可以认为任务的分配可以根据需要实现化。

同时mali-t764还支持gpgpu（通用计算图形处理器）加速复杂和计算密集型算法或操作。rk3288还将在可穿戴设备上大放异彩。rk3288可以辨别出摄像头画面上运动的物体，利用的性能进行实时渲染，从而带来更佳的体验，像图像拼接识别、面部识别、笑容识别，地标识别甚至皱眉识别这样的应用都可以轻易实现。

mali-t764进一步加强了对不同api的支持，正式加入了对opengl es3.0、opencl 1.1、directx 11.1以及renderscript的支持。靠这些新加入的api，集成mali-t764gpu的处理器可以显示更为精细的图形，有机会运行在传统的pc平台，让pc软件和移动软件的相互移植变得更为方便。[3]

ARM 帧缓冲压缩，低内存带宽享用高画质

支持ARM 帧缓冲压缩格式也是Mali-T764的一大亮点，这让它可以在运行高画质游戏时缓解内存带宽不足的压力。很多采用Mali-400MP4+视网膜屏幕的平板在zui高分辨率模式下都会出现非常卡顿的现象，一大程度上就是显存带宽不足的体现。为解决视频所遇到的内存带宽难题，ARM 开发了 ARM 帧缓冲压缩格式，该格式能够提供快速、实时的无损压缩与解压缩。这降低整个系统对内存带宽的要求，并将相应功耗降低至多达50% 。

此外，Mali-T764在支持OpenGL ES 3.0时还支持ASTC 纹理压缩格式，除了能减少纹理材质的传输大小外，这也让手持设备的高质量游戏得以全面减少纹理材质上的带宽耗损，维持游戏的画面质量又可减少带宽。

瑞芯微RK3288与苹果A7性能对比

着色器对比

苹果新A7处理器采用PowerVR 6核心架构。PowerVR 6架构为统一超标量渲染引擎，着色器阵列设计，以四个着色器为一个SIMD 阵列设计。A7所采用的是IMG PowerVR G6430，4 个SIMD 阵列设计。

瑞芯微RK3288所采用的Mali-T764支持特性并不逊色于A7的PowerVR G6430。Mali-T764采用的是ARM的第三代MIDgard架构，也是采用当前PC上GPU一样的统一渲染架构，特点就是在提升通用处理功能的同时，依然保持足够的图形处理效率，包括有64-bit双精度浮点运算和64-bit整数运算，64-bit寻址，shader单元间的内存同步。不过，相对于PowerVR 6430核心所采用分解矢量引擎和scalar引擎的SIMD构架，Mali-T764的运算管线采用128-bit矢量引擎设计，拥有灵活的管线配置。特别是作为Mali –T700系列的zui高型号，Mali-T764通过单一的调度机制，每个核心群都会分到相同的处理任务，可以根据需要实现性能化。可以说，如果从硬性配置上，两者势均力敌，但在运算管线设计上Mali-T764更胜*。

图形处理性能，Mali-T764与G6230大致旗鼓相当

A7的PowerVR G6430的性能来看，与A6X处理器PowerVR 554MP4相差不大：同频下浮点性能和iPad4上的SGX554MP4相同，三角填充率及纹理性能是SGX554MP4的两倍。

?Mali-T764每个着色器都配有四个ALU（算数逻辑单元）、一个LSU（本地存储单元）、一个纹理单元。而且Mali-T764的四个着色器族组都拥有独立的共享L2缓存的核心群，四个核心群之间则通过单一的dispatcher，每个核心群都会分到相同的处理任务。更重要的是，各个shader均拥有独立的线程调度，可对各自的管线分配来自各个线程的程序指令，从而使得各个管线可灵活用于执行来自各自线程的指令，这样如果有128条管线，那么就可以同时运行128个线程，而Mali-T764的shader单元zui多能够控制800个以上的线程。这种灵活的线程调度方式，让Mali-T764的shader单元拥有更高的运算效率，甚至拥有媲美于桌面PC般的图形性能。

Mali- T760在搭配16个核心600MHz下，色器性能峰值为326.4 GFLOPS、1066M三角形生成率及9600M像素填充率，此时完胜于A7的PowerVR G6430。由于Mali- T764只搭配4个核心，因此性能只有Mali- T760mp16的四分之一，另外mali系列计算浮点为FP16情况下，而其他厂商GPU皆在FP32下计算，因此Mali- T760浮点性能实际上只有宣传数值一半左右的浮点性能，mali T764FP32下浮点为81.6 GFLOPS，实际FP16下浮点大约只有40.8 GFLOPS，而G6230在600mhz下FP16为 76.8GFLOPS，因此T764性能比不上G6230，但差距不太大。

关键词：RK3288,Cortex-A17芯片,瑞芯微RK3288,ARM方案公司,嵌入式方案

版权与免责声明

凡本网注明"来源：智能制造网的所有作品，版权均属于智能制造网，转载请必须注明智能制造网，https://www.gkzhan.com。违反者本网将追究相关法律责任。
本网转载并注明自其它来源的作品，目的在于传递更多信息，并不代表本网赞同其观点或证实其内容的真实性，不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时，必须保留本网注明的作品来源，并自负版权等法律责任。
如涉及作品内容、版权等问题，请在作品发表之日起一周内与本网联系，否则视为放弃相关权利。