OpenCL ARM Mali GPU存储器层次

ARM没有给出T764 GPU中寄存器的任何信息,包括数量、带宽、延迟等。
每个渲染核具有一个纹理单元,但是ARM并没有给出纹理缓存的信息,笔者怀疑纹理缓存由一组4个核心共享,由于纹理是只读的,因此共享时并无缓存一致性的问题。
所有的渲染核共享一个统一的二级缓存,ARM Mali T764 GPU上的二级缓存分成两块,每块大小为512 KB,如果每块每周期提供64位访存带宽,那么两块可提供128位访存带宽。
采用双通道内存,每个内存通道带宽为64位,假设采用的内存LPDDR等效频率为1.8 GHz,则内存带宽为28.8 GB/s。
Mali T764 GPU没有独立的常量存储器缓存,也没有专用的局部存储器硬件。

赞(1)
未经允许不得转载:极客笔记 » OpenCL ARM Mali GPU存储器层次
分享到: 更多 (0)

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址