您现在的位置:智能制造网>嵌入式系统频道 >行业资讯

RK3288 Cortex-A17芯片

2016年06月01日 11:37:33来源:深圳市九鼎创展科技有限公司

跑分王:Cortex-A17芯片

瑞芯微RK3288处理器采用Cortex-A17,其zui大的特点就是

 

与Cortex-A15一样采用*乱序执行架构,其性能提升有着*的效果。双指令译码、双地址产生器(AGU)、多指令派发(multi issue)等特别架构的设计,使得Cortex-A17在指令执行效率上有相当大的提升,正是基于以上改进,在同样的频率下,Cortex-A17的单线程性能要比Cortex-A9有40%的提升,而频率高达1.8GHz的RK3288性能较上一代RK3188有50%的性能提升。

游戏王:Mali-T764系列GPU的芯片

在之前RK3188处理器中,瑞芯微使用的GPU Mali-400一直是RK3188的

软肋。而在的RK3288处理器中,GPU采用Mali T76X系列GPU,Mali T764核心zui大特点是采用第三代Midgard架构,相比于T62x/65x系列GPU所采用的第二代MIDgard架构,第三代Midgard架构在内部架构上进行了重新设计,特别是大幅度改变了着色器核心的配置方式;着色器数量高达4个着色器核心,是之前的T654的两倍;2400M/s的像素填充率和300M/s的三角形生成率相对于过去获得了成倍的提升。

超清王:支持4Kx2K 实时硬解H.265、HDMI2.0

瑞芯微RK3288是支持4Kx2K,以及硬解H.265视频的芯片,带给用户清

晰的视觉享受作为更有效率的高清压缩格式,H.265标准已经成为了各视频的救命稻草。与H.264相比,H.265使用了大小浮动的编码单位以及更*的帧内预 知模式,同画质的情况下使用H.265的视频可比H.264节省一半的带宽。瑞芯微RK3288是业界支持4K H.265实时硬件解码的ARM内核芯片,在视频的支持上发挥了其以往的音视频领域的积累优势,真正支持4K视频的输出及播放。[1] 

RK3288GPU:Mali -T764详解

第三代midgard架构,火力更足

mali-t764zui大特色就是采用第三代midgard架构,在内部架构上进行了重新设计,大幅度改变了着色器核心的配置方式。着色器间的内存同步以及核心群间的scu依然保持。不过核心群间依然采用

 

独立的l2 缓存和snoop单元,彼此之间的通过amba4总线实现,因此可以认为任务的分配可以根据需要实现化。

同时mali-t764还支持gpgpu(通用计算图形处理器)加速复杂和计算密集型算法或操作。rk3288还将在可穿戴设备上大放异彩。rk3288可以辨别出摄像头画面上运动的物体,利用的性能进行实时渲染,从而带来更佳的体验,像图像拼接识别、面部识别、笑容识别,地标识别甚至皱眉识别这样的应用都可以轻易实现。

mali-t764进一步加强了对不同api的支持,正式加入了对opengl es3.0、opencl 1.1、directx 11.1以及renderscript的支持。靠这些新加入的api,集成mali-t764gpu的处理器可以显示更为精细的图形,有机会运行在传统的pc平台,让pc软件和移动软件的相互移植变得更为方便。[3]

 

ARM 帧缓冲压缩,低内存带宽享用高画质

 

支持ARM 帧缓冲压缩格式也是Mali-T764的一大亮点,这让它可以在运行高画质游戏时缓解内存带宽不足的压力。很多采用Mali-400MP4+视网膜屏幕的平板在zui高分辨率模式下都会出现非常卡顿的现象,一大程度上就是显存带宽不足的体现。为解决视频所遇到的内存带宽难题,ARM 开发了 ARM 帧缓冲压缩格式,该格式能够提供快速、实时的无损压缩与解压缩。这降低整个系统对内存带宽的要求,并将相应功耗降低至多达50% 。

此外,Mali-T764在支持OpenGL ES 3.0时还支持ASTC 纹理压缩格式,除了能减少纹理材质的传输大小外,这也让手持设备的高质量游戏得以全面减少纹理材质上的带宽耗损,维持游戏的画面质量又可减少带宽。

瑞芯微RK3288与苹果A7性能对比

着色器对比

苹果新A7处理器采用PowerVR 6核心架构。PowerVR 6架构为统一超标量渲染引擎,着色器阵列设计,以四个着色器为一个SIMD 阵列设计。A7所采用的是IMG PowerVR G6430,4 个SIMD 阵列设计。

瑞芯微RK3288所采用的Mali-T764支持特性并不逊色于A7的PowerVR G6430。Mali-T764采用的是ARM的第三代MIDgard架构,也是采用当前PC上GPU一样的统一渲染架构,特点就是在提升通用处理功能的同时,依然保持足够的图形处理效率,包括有64-bit双精度浮点运算和64-bit整数运算,64-bit寻址,shader单元间的内存同步。不过,相对于PowerVR 6430核心所采用分解矢量引擎和scalar引擎的SIMD构架,Mali-T764的运算管线采用128-bit矢量引擎设计,拥有灵活的管线配置。特别是作为Mali –T700系列的zui高型号,Mali-T764通过单一的调度机制,每个核心群都会分到相同的处理任务,可以根据需要实现性能化。可以说,如果从硬性配置上,两者势均力敌,但在运算管线设计上Mali-T764更胜*。

图形处理性能,Mali-T764与G6230大致旗鼓相当

A7的PowerVR G6430的性能来看,与A6X处理器PowerVR 554MP4相差不大:同频下浮点性能和iPad4上的SGX554MP4相同,三角填充率及纹理性能是SGX554MP4的两倍。

?Mali-T764每个着色器都配有四个ALU(算数逻辑单元)、一个LSU(本地存储单元)、一个纹理单元。而且Mali-T764的四个着色器族组都拥有独立的共享L2缓存的核心群,四个核心群之间则通过单一的dispatcher,每个核心群都会分到相同的处理任务。更重要的是,各个shader均拥有独立的线程调度,可对各自的管线分配来自各个线程的程序指令,从而使得各个管线可灵活用于执行来自各自线程的指令,这样如果有128条管线,那么就可以同时运行128个线程,而Mali-T764的shader单元zui多能够控制800个以上的线程。这种灵活的线程调度方式,让Mali-T764的shader单元拥有更高的运算效率,甚至拥有媲美于桌面PC般的图形性能。

Mali- T760在搭配16个核心600MHz下,色器性能峰值为326.4 GFLOPS、1066M三角形生成率及9600M像素填充率,此时完胜于A7的PowerVR G6430。由于Mali- T764只搭配4个核心,因此性能只有Mali- T760mp16的四分之一,另外mali系列计算浮点为FP16情况下,而其他厂商GPU皆在FP32下计算,因此Mali- T760浮点性能实际上只有宣传数值一半左右的浮点性能,mali T764FP32下浮点为81.6 GFLOPS,实际FP16下浮点大约只有40.8 GFLOPS,而G6230在600mhz下FP16为 76.8GFLOPS,因此T764性能比不上G6230,但差距不太大。

  • 凡本网注明"来源:智能制造网的所有作品,版权均属于智能制造网,转载请必须注明智能制造网,https://www.gkzhan.com。违反者本网将追究相关法律责任。
  • 本网转载并注明自其它来源的作品,目的在于传递更多信息,并不代表本网赞同其观点或证实其内容的真实性,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时,必须保留本网注明的作品来源,并自负版权等法律责任。
  • 如涉及作品内容、版权等问题,请在作品发表之日起一周内与本网联系,否则视为放弃相关权利。

热门频道