OpenCL NVIDIA CUDA兼容的GPU

NVIDIA在2007年发布CUDA,扩大在GPU上做通用计算的领域范围,同时让GPU计算这个概念深入人心。下面我们将以NVIDIA当前比较新的GPU架构Maxwell以及最近的GPU型号——GM204来为大家介绍NVIDIA的GPU架构。
GM204是第一款完整实现NVIDIA第10代架构Maxwell的GPU。它由一组图形处理器簇(Graphics Processing Cluster,GPC)、流多处理器(Streaming multiprocessor,简称SM,相当于OpenCL中的CU)以及存储器控制器构成。而GM204含有4个GPC,16个Maxwell SM(简称SMM)以及4个存储器控制器。GeForce GTX 980使用了完整的这些架构组建。而GeForce GTX 970则含有13个SMM,比GeForce980少了3个。
在GeForce GTX 980中,每个SMM含有128颗CUDA核心(在OpenCL中对应于PE), 8个纹理单元;16个SMM则一共具备2048颗CUDA核心和128个纹理单元。它同时含有4个64位存储器控制器(总共256位)。每个存储器控制器绑有512KB的L2 Cache。下面将描述Maxwell架构的核心组件——SMM。
在NVIDIA的GPGPU中,SM是其心脏部分。而新的Maxwell架构的SMM则含有4个warp(对应于AMD GPGPU的wavefront)调度器,每个warp调度器能够在每个时钟周期分发两条指令。每个SMM将其内部的CUDA核心划分为4组,正好每组对应一个warp调度器,每组含有32个CUDA核心,那么一个SMM正好有128个CUDA核心。每组划分具有其自己的专用资源用于调度分发指令以及指令缓存。
Maxwell的每个SMM具有自己专用的96KB共享存储器(对应于AMD GPU中的LDS, AMD GCN架构的LDS一共64KB)。

赞(0)
未经允许不得转载:极客笔记 » OpenCL NVIDIA CUDA兼容的GPU
分享到: 更多 (0)

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址