OpenCL 创建命令队列

在OpenCL上下文中,有内存、程序和内核对象,对这些对象的操作就需要使用命令队列。一条命令就是主机发送给设备的一条消息,用来告诉设备执行一个操作。这个操作包含主机与设备间、设备内的数据拷贝与内核执行。命令提交到命令队列中,命令队列把需要执行的命令发送给设备。需要注意的是,每条命令队列只能关联一个设备,如果要同时使用多个设备,则需要创建多个命令队列,每个命令队列关联到一个设备,如下图所示。

发送命令到设备

命令队列中的命令,只能是主机发送给设备,而设备不能发送命令给主机。默认情况下,命令队列顺序处理接收到的命令,但是在创建命令队列时可以修改默认行为。



clCreateCommandQueueWithProperties

虽然旧版本OpenCL标准中的clCreateCommandQueue函数也可以给命令队列指定特性,但是真正可用的只有CL_QUEUE_PEROPERTIES,对于乱序执行绝大多数设备并不支持。在OpenCL 2.0中对该函数进行了扩展,扩展后的函数如下:

cl_command_queue clCreateCommandQueueWithProperties(
                                    cl_context context,
                                    cl_device_id device,
                                    const cl_queue_properties *properties,
                                    cl_int *errcode_ret)

函数返回cl_command_queue,除了第三个参数properties,其他参数都是比较容易理解的。对于第三个参数properties,指定了命令队列的属性,及其相应的值的列表。每个属性名称后面紧跟对应的值。列表以0结尾。properties属性名称及其描述如下表所示:

cl_queue_property值列表

设置CL_QUEUE_PROFILING_ENABLE,可以接收命令队列处理命令的时间事件,通过这个开发人员可以分析程序性能参数。

默认情况下,命令队列里的命令遵循先进先出(FIFO)原则,设置CL_QUEUE_OUT_OF_OERDER_EXEC_MODE_ENABLE,设备将乱序执行内核,如设备将会在前一个内核执行命令完成之前执行其他内核。对于数据有前后依赖系的两个内核来说,这就需要同步。可以使用事件来实现同步。

在OpenCL 2.0中,允许设备向命令队列提交命令,这个过程不需要主机参与。这样的命令队列,需要设置为CL_QUEUE_ON_DEVICE|CL_QUEUE_ON_DEVICE_DEFAULT。

如下代码展示了如何使用cl_queue_properties属性值来创建命令队列:

cl_queue_properties props[]=
{
};
    CL_QUEUE_PROPERTIES, CL_QUEUE_OUT_OF_ORDER_EXEC_MODE_ENABLE
    | CL_QUEUE_ON_DEVICE | CL_QUEUE_ON_DEVICE_DEFAULT,
    0
clCreateCommandQueueWithProperties(context, device, props, &err);



clGetCommandQueueInfo

对于创建的命令队列,可以通过下列函数查询命令队列各个属性信息:

cl_int clGetCommandQueueInfo(cl_command_queue command_queue,
                                  cl_command_queue_info parame_name,
                                  size_t param_value_size,
                                  void *param_value,
                                  size_t *param_value_size_ret)

参数param_name为查询属性名称,取值见下表,参数param_value返回命令队列查询属性信息。

命令队列属性查询

可以使用如下函数来改变命令队列引用计数的值:

cl_int clRetainCommandQueue(cl_command_queue command_queue)
cl_int clReleaseCommandQueue(cl_command_queue command_queue)

clRetainCommandQueue增加命令队列引用计数(引用计数+1)。
clReleaseCommandQueue减少命令队列引用计数(引用计数-1)。

赞(0)
未经允许不得转载:极客笔记 » OpenCL 创建命令队列

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
OpenCL 基本概念
OpenCL 是什么OpenCL 平台模型OpenCL 执行模型OpenCL 上下文简介OpenCL 命令队列简介OpenCL 在设备上执行内核OpenCL 存储器区域OpenCL 存储器对象OpenCL 共享虚拟存储器OpenCL 与OpenGL
OpenCL 基础教程
OpenCL 在Windows上搭建开发环境OpenCL 在Linux上搭建开发环境OpenCL 在OS X上搭建开发环境OpenCL 第一个程序OpenCL 平台OpenCL 设备OpenCL 创建上下文OpenCL 创建命令队列OpenCL 创建Program对象OpenCL 编译Program对象OpenCL 查询和管理Program对象OpenCL 创建内核对象OpenCL 设置内核参数OpenCL 查询和管理内核对象OpenCL 执行内核OpenCL 编写内核代码OpenCL 错误处理
OpenCL C特性
OpenCL 地址空间修饰符OpenCL 函数修饰符OpenCL 对象访问修饰符OpenCL 标量数据类型OpenCL 为什么要有矢量数据类型OpenCL 矢量初始化OpenCL 读取和修改矢量分量OpenCL 运算符OpenCL 维度和工作项OpenCL 工作组OpenCL 矢量数据拷贝OpenCL 异步拷贝和预取OpenCL 数学函数OpenCL 公共函数OpenCL 几何函数OpenCL 整数函数OpenCL 关系函数OpenCL 杂项矢量函数OpenCL 同步函数OpenCL 原子函数OpenCL 内建图像读函数OpenCL 内建无采样器图像读函数OpenCL 内建图像写函数OpenCL 内建图像查询函数OpenCL 工作组函数OpenCL 内建管道读/写函数OpenCL 内建工作组管道读/写函数OpenCL 内建管道查询函数OpenCL 设备队列OpenCL Blocks语法OpenCL 设备队列相关函数OpenCL 子内核存储器可见性OpenCL 设备队列的使用示例
OpenCL 存储器对象
OpenCL 存储器对象OpenCL 分配缓冲区对象OpenCL 创建子缓冲区对象OpenCL 图像对象和采样器对象OpenCL 图像对象OpenCL 图像格式描述符OpenCL 图像描述符OpenCL 图像对象查询OpenCL 采样器对象OpenCL 主机端采样器对象OpenCL 设备端采样器对象OpenCL 图像旋转示例OpenCL 管道OpenCL 创建管道对象OpenCL 管道对象查询OpenCL 主机与设备间数据传输OpenCL 图像对象主机与设备间数据拷贝OpenCL 缓冲区对象数据填充OpenCL 图像对象数据填充OpenCL 缓冲区对象间数据传输OpenCL 图像对象和缓冲区对象间数据拷贝OpenCL 缓冲区对象映射OpenCL 图像对象映射OpenCL 解映射OpenCL 共享虚拟存储器OpenCL SVM缓冲创建与释放OpenCL SVM缓冲映射与解映射OpenCL SVM缓冲填充与拷贝OpenCL SVM类型OpenCL SVM特性OpenCL 共享虚拟存储器示例OpenCL 存储器一致性模型OpenCL 存储器次序规则OpenCL 原子操作的存储器次序规则OpenCL 栅栏操作的存储器次序规则OpenCL 工作组函数的存储器次序规则OpenCL 主机端与设备端命令的存储器次序规则OpenCL 关于存储器次序在实际OpenCL计算设备中的实现
OpenCL 同步及事件机制
OpenCL 同步及事件机制OpenCL 主机端的OpenCL同步OpenCL OpenCL事件机制OpenCL 对OpenCL事件的标记和栅栏OpenCL 内核程序中的同步OpenCL 工作组内同步OpenCL 原子操作OpenCL 1.2中的原子操作OpenCL 2.0中的原子操作OpenCL 局部存储器与全局存储器间的异步拷贝OpenCL 工作组间同步
OpenCL 与OpenGL互操作
OpenCL 与OpenGL互操作OpenCL 从一个OpenGL上下文来创建OpenCL上下文OpenCL 使用OpenGL共享的缓存对象OpenCL 使用OpenGL纹理数据OpenCL 共享OpenGL渲染缓存OpenCL 从一个OpenCL存储器对象查询OpenGL对象信息OpenCL 访问共享对象的OpenCL与OpenGL之间的同步OpenCL AMD Cayman架构GPUOpenCL AMD GCN架构的GPUOpenCL NVIDIA CUDA兼容的GPUOpenCL NVIDIA GPU架构的执行模型OpenCL NVIDIA GPU的全局存储器OpenCL NVIDIA GPU的局部存储器OpenCL ARM Mali GPU硬件架构OpenCL ARM Mali GPU存储器层次OpenCL ARM Mali GPU OpenCL映射