OpenCL 维度和工作项

OpenCL 平台模型中,我们介绍了OpenCL平台模型。但是对于硬件上的两个概念:计算单元、处理单元,并未与软件上的两个概念:工作项、工作组的关系做详细讲解。现在通过一个例子来类比这几者之间的关系。

某个学校高一的年级,这个年级当中会有多个班级,我们假设班级个数为8。高一年级都有计算机课程,会依次去计算机机房里上机,计算机机房里会有电脑,我们假设电脑数为32。每个在机房里的同学根据机房里黑板上老师布置的任务,都在完成属于自己的任务。

对于这样一个场景中的事物与OpenCL中几个概念的类比为:工作项就好比每位同学,工作组就好比一个班级,多个同学组成一个班级,多个工作项也组成一个工作组;机房里的电脑就好比处理单元,机房就好比计算单元。多个类似机房的计算单元构成了一个OpenCL设备。

上述例子就很好地把OpenCL软件层面的工作项和工作组与OpenCL设备硬件层面的处理单元和计算单元联系起来。

在clEnqueueNDRangeKernel()函数中,参数指定了内核执行工作项的维度、每个维度上的工作项大小和每个维度上每个工作组里的工作项大小。对于每个工作项,需要通过一个专属于自己的ID来执行与其他工作项不同的任务,这个ID在全局工作项中是唯一的,在一个工作组内也是唯一的。在本节中,我们分别从全局工作项ID和工作组中工作项ID来讲述如何获得这个唯一的ID。

维度和工作项

工作项是OpenCL中执行具体内核任务的最小单元,工作项的数量是我们在调用clEnqueueNDRangeKernel()函数时人为设定的。每个工作项在所有的工作项中都有一个区别于其他工作项的ID,这个ID的起始编号我们也可以人为设定。工作项虽然执行相同代码,但是通过这个ID来确定每个工作项的任务数据,是典型的SIMT模式。

对于一幅灰度图像Img,通过确定x和y方向的位置,我们可以得到该点位置上的灰度值Img(x,y)。如果我们把x和y方向分别用不同的工作项来执行,要处理完这幅灰度图像,我们可以使用二维的工作项。

对于工作项的数目、ID和维度,在OpenCL中都提供了这样的内置函数来查询这几个值。如下表所示。

内核NDRange相关函数(1)

为了更好地让读者理解上述函数,我们假定一张256×256的灰度图,x方向全局工作项ID需要从3开始;y方向全局工作项ID从5开始,对于如下代码:

主机端代码:

……
//x方向全局工作项ID为252,y方向全局工作项ID为250
const size_t globalSize[2] = {252, 250};
const size_t offset[2] = {3, 5}; //x方向初始偏移3,y方向初始偏移5
err = clEnqueueNDRangeKernel(cmdqueue, kernel, 2, offset,
                                  globalSize, NULL, 0, NULL, NULL);
……

内核代码:

kernel void OffSetTest(_global uchar *output)
{
    int index_x = get_global_id(0);        //值为3~255
    int index_y = get_global_id(1);        //值为5~255
    int size_x = get_global_size(0);       //值为252
    int size_y = get_global_size(1);       //值为250
    int offset_x = get_global_offset(0);   //值为3
int offset_y = get_global_offset(1);       //值为5
int dim_size = get_work_dim();             //值为2
}

上述代码中,x方向全局工作项ID的初始偏移量为3,函数clEnqueueNDRangeKernel()设定x方向全局工作项数目为252,所以x方向全局工作项ID为:3(0+3)~255(252+3)。同理y方向全局工作项ID为:5~255。

赞(0)
未经允许不得转载:极客笔记 » OpenCL 维度和工作项

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
OpenCL 基本概念
OpenCL 是什么OpenCL 平台模型OpenCL 执行模型OpenCL 上下文简介OpenCL 命令队列简介OpenCL 在设备上执行内核OpenCL 存储器区域OpenCL 存储器对象OpenCL 共享虚拟存储器OpenCL 与OpenGL
OpenCL 基础教程
OpenCL 在Windows上搭建开发环境OpenCL 在Linux上搭建开发环境OpenCL 在OS X上搭建开发环境OpenCL 第一个程序OpenCL 平台OpenCL 设备OpenCL 创建上下文OpenCL 创建命令队列OpenCL 创建Program对象OpenCL 编译Program对象OpenCL 查询和管理Program对象OpenCL 创建内核对象OpenCL 设置内核参数OpenCL 查询和管理内核对象OpenCL 执行内核OpenCL 编写内核代码OpenCL 错误处理
OpenCL C特性
OpenCL 地址空间修饰符OpenCL 函数修饰符OpenCL 对象访问修饰符OpenCL 标量数据类型OpenCL 为什么要有矢量数据类型OpenCL 矢量初始化OpenCL 读取和修改矢量分量OpenCL 运算符OpenCL 维度和工作项OpenCL 工作组OpenCL 矢量数据拷贝OpenCL 异步拷贝和预取OpenCL 数学函数OpenCL 公共函数OpenCL 几何函数OpenCL 整数函数OpenCL 关系函数OpenCL 杂项矢量函数OpenCL 同步函数OpenCL 原子函数OpenCL 内建图像读函数OpenCL 内建无采样器图像读函数OpenCL 内建图像写函数OpenCL 内建图像查询函数OpenCL 工作组函数OpenCL 内建管道读/写函数OpenCL 内建工作组管道读/写函数OpenCL 内建管道查询函数OpenCL 设备队列OpenCL Blocks语法OpenCL 设备队列相关函数OpenCL 子内核存储器可见性OpenCL 设备队列的使用示例
OpenCL 存储器对象
OpenCL 存储器对象OpenCL 分配缓冲区对象OpenCL 创建子缓冲区对象OpenCL 图像对象和采样器对象OpenCL 图像对象OpenCL 图像格式描述符OpenCL 图像描述符OpenCL 图像对象查询OpenCL 采样器对象OpenCL 主机端采样器对象OpenCL 设备端采样器对象OpenCL 图像旋转示例OpenCL 管道OpenCL 创建管道对象OpenCL 管道对象查询OpenCL 主机与设备间数据传输OpenCL 图像对象主机与设备间数据拷贝OpenCL 缓冲区对象数据填充OpenCL 图像对象数据填充OpenCL 缓冲区对象间数据传输OpenCL 图像对象和缓冲区对象间数据拷贝OpenCL 缓冲区对象映射OpenCL 图像对象映射OpenCL 解映射OpenCL 共享虚拟存储器OpenCL SVM缓冲创建与释放OpenCL SVM缓冲映射与解映射OpenCL SVM缓冲填充与拷贝OpenCL SVM类型OpenCL SVM特性OpenCL 共享虚拟存储器示例OpenCL 存储器一致性模型OpenCL 存储器次序规则OpenCL 原子操作的存储器次序规则OpenCL 栅栏操作的存储器次序规则OpenCL 工作组函数的存储器次序规则OpenCL 主机端与设备端命令的存储器次序规则OpenCL 关于存储器次序在实际OpenCL计算设备中的实现
OpenCL 同步及事件机制
OpenCL 同步及事件机制OpenCL 主机端的OpenCL同步OpenCL OpenCL事件机制OpenCL 对OpenCL事件的标记和栅栏OpenCL 内核程序中的同步OpenCL 工作组内同步OpenCL 原子操作OpenCL 1.2中的原子操作OpenCL 2.0中的原子操作OpenCL 局部存储器与全局存储器间的异步拷贝OpenCL 工作组间同步
OpenCL 与OpenGL互操作
OpenCL 与OpenGL互操作OpenCL 从一个OpenGL上下文来创建OpenCL上下文OpenCL 使用OpenGL共享的缓存对象OpenCL 使用OpenGL纹理数据OpenCL 共享OpenGL渲染缓存OpenCL 从一个OpenCL存储器对象查询OpenGL对象信息OpenCL 访问共享对象的OpenCL与OpenGL之间的同步OpenCL AMD Cayman架构GPUOpenCL AMD GCN架构的GPUOpenCL NVIDIA CUDA兼容的GPUOpenCL NVIDIA GPU架构的执行模型OpenCL NVIDIA GPU的全局存储器OpenCL NVIDIA GPU的局部存储器OpenCL ARM Mali GPU硬件架构OpenCL ARM Mali GPU存储器层次OpenCL ARM Mali GPU OpenCL映射