ARM没有给出T764 GPU中寄存器的任何信息,包括数量、带宽、延迟等。
每个渲染核具有一个纹理单元,但是ARM并没有给出纹理缓存的信息,笔者怀疑纹理缓存由一组4个核心共享,由于纹理是只读的,因此共享时并无缓存一致性的问题。
所有的渲染核共享一个统一的二级缓存,ARM Mali T764 GPU上的二级缓存分成两块,每块大小为512 KB,如果每块每周期提供64位访存带宽,那么两块可提供128位访存带宽。
采用双通道内存,每个内存通道带宽为64位,假设采用的内存LPDDR等效频率为1.8 GHz,则内存带宽为28.8 GB/s。
Mali T764 GPU没有独立的常量存储器缓存,也没有专用的局部存储器硬件。
OpenCL ARM Mali GPU存储器层次
未经允许不得转载:极客笔记 » OpenCL ARM Mali GPU存储器层次
- OpenCL ARM Mali GPU OpenCL映射
- OpenCL ARM Mali GPU硬件架构
- OpenCL NVIDIA GPU的局部存储器
- OpenCL NVIDIA GPU的全局存储器
- OpenCL NVIDIA GPU架构的执行模型
- OpenCL NVIDIA CUDA兼容的GPU
- OpenCL AMD GCN架构的GPU
- OpenCL AMD Cayman架构GPU
- OpenCL 访问共享对象的OpenCL与OpenGL之间的同步
- OpenCL 从一个OpenCL存储器对象查询OpenGL对象信息
- OpenCL 共享OpenGL渲染缓存
- OpenCL 使用OpenGL纹理数据
- OpenCL 使用OpenGL共享的缓存对象
- OpenCL 从一个OpenGL上下文来创建OpenCL上下文
- OpenCL 与OpenGL互操作