OpenCL 编译Program对象

OpenCL是一个跨平台工业标准,OpenCL C代码只有在选择设备对象后才能确定将会运行在何种计算设备上。

clBuildProgram

在运行前需要对程序对象进行构建,如以下代码所示:

cl_int clBuildProgram(cl_program program,
                            cl_uint num_deivces,
                            const cl_device_id *device_list,
                            const char *options,
                            void(CL_CALLBACK *pfn_notify)(
                                  cl_program program,
                                  void *user_data),
                            void *user_data)

clBuildProgram()会为指定的所有设备构建程序对象(或者,如果没有指定设备列表,则为与上下文关联的所有设备构建程序对象)。这一步实际等价于在一个C程序上调用编译器与链接器。第4个参数设置编译器选项,这些编译选项与常用的编译器(如gcc)类似,但有很大一部分是专门针对OpenCL。编译器选项可以分为以下类型:

  • 预处理选项;
  • 数学选项;
  • 优化选项;
  • 其他选项。

这几个选项的详细情况,如下表所示。

编译选项

下面两行代码展示了如何使用上表中的这些选项。为一个设备(device)编译和链接program,使用的编译链接选项为:-cl-std、-cl-mad-enable和-Werror

const char options[] = " -cl-std = CL1.1 -cl-mad-enable
                              -Werror";
clBuildProgram(program, 1, &device, option, NULL, NULL);



clCompileProgram

大家可能会发现,在上述讲述构件程序内容中,我们使用clBuildProgram()把编译和链接过程合在一起处理了。但是从OpenCL 1.2开始,可以把编译和链接分开。分开编译和链接支持如下使用:

  • 分开编译和链接步骤。编译程序源码,产生一个编译过的二进制对象。在一个单独的步骤中,这个二进制对象与其他编译过的程序对象链接成一个程序。

  • 内嵌头文件。在编译选项中-I选项可以指定包含程序源码的头文件目录。从OpenCL 1.2开始扩展了该功能,运行头文件代码来源于其他程序对象。

  • 库。使用链接器链接编译过的对象和库到一个程序中,或者把编译过的二进制生成一个库。

可以使用如下函数实现编译:

cl_int clCompileProgram(cl_program program,
                            cl_uint num_devices,
                            const cl_device_id *device_list,
const char *options,
const_cl_program *input_header,
const char **header_include_name,
void(CL_CALLBACK *pfn_notify)
                    (cl_program program, void *user_data),
void *user_data)

对于clCompileProgram(),参数program为编译出的程序对象。参数input_header,是使用clCreateProgramWithSource创建的内嵌头文件代码的程序数组。参数num_input_headers指定参数input_header中程序的数量。其他参数与clBuildProgram()中参数类似。

#include 〈foo.h>
#include 〈mydir/myinc.h>
kernel void   image_filter (int n, int m,
                              constant float *filter_weights,
read_only image2d_t src_image,
                              write_only image2d_t dst_image)
{
    ...
}

对于如上内核代码,包含了两个头文件foo.h和mydir/myinc.h。下列代码展示了这两个头文件在程序对象中如何传递:

cl_program foo_pg = clCreateProgramWithSource(context, 1,
&foo_header_src, NULL, &err);
cl_program myinc_pg = clCreateProgramWithSource(context, 1,
&myinc_header_src, NULL, &err);
cl_program input_headers[2] = { foo_pg, myinc_pg };
char *input_header_names[2] = { "foo.h", "mydir / myinc.h" };
clCompileProgram(program_A,
                    0, NULL,        //num_devices & device_list
                    NULL,           //compile_options
                    2,              //num_input_headers
                    input_headers,
                    input_header_names,
                    NULL, NULL);    //pfn_notify & user_da

上述代码展示了内核代码与已编译过的头文件二进制对象如何一起编译。两个头文件先用clCreateProgramWithSource()函数编译为二进制。内核代码包含了两个头文件,故num_input_headers设置为2,input_header_name数组分为两个头文件名称。



clLinkProgram

对于已编译好的对象,可使用如下函数链接成程序对象:

cl_program clLinkProgram(cl_context context,
                              cl_uint num_devices,
                              const cl_device_id *device_list,
                              const chat *options,
                              cl_uint num_input_programs,
const cl_program *input_programs,
void(CL_CALLBACK *pfn_notify)cl_program
                        ( program,
                        void *user_data),
      void *user_data,
      cl_int *errcode_ret)

参数input_programs是链接到程序对象中的已编译过的二进制或库的程序对象。参数num_input_programs指定参数input_programs中程序对象数目。其他参数与clBuildProgram()中参数类似。

下面通过一个例子详细讲解分开编译和链接的使用。kernel.cl文件内容如下:

#include"add.h"
kernel void call_test(global float *A, const float b)
{
    int index = get_global_id(0);
    A[index] = add(A[index], b);
}

add.h文件内容如下:

float add(float a, float b)
{
    return (a + b) + 100.0;
}

对应的主机端代码如下所示,基于减少篇幅的原因,去掉了许多不重要的代码。

……
cl_program program_cl, program_head, program;
unsigned char *program_file;
size_t program_size       //读取内核源码
read_file(&program_file, &program_size, "kernel.cl");
//创建内核程序对象
program_cl = clCreateProgramWithSource(context, 1, &program_file,
                                              &program_size, &err);
//读取头文件源码
read_file(&program_file, &program_size, "add.h");
//创建头文件程序对象
program_ head = clCreateProgramWithSource(context, 1, &program_file,
                                                  &program_size, &err);
const char *input_head_names[1] = {"add.h"};
cl_program input_head[1] = {program_head};
//把头文件程序对象与内核程序对象一起编译
err = clCompileProgram(program_cl, 0, NULL, 0, 1, input_head,
                            input_head_names, NULL, NULL);
//链接为程序
program = clLinkProgram(context, num_device, devices, NULL, 1,
&program_cl, NULL, NULL, &err);
……

大家可能会发现上表编译选项中-I选项也可以完成如上功能,对于该实现方式,在此就不列出代码。

赞(0)
未经允许不得转载:极客笔记 » OpenCL 编译Program对象

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
OpenCL 基本概念
OpenCL 是什么OpenCL 平台模型OpenCL 执行模型OpenCL 上下文简介OpenCL 命令队列简介OpenCL 在设备上执行内核OpenCL 存储器区域OpenCL 存储器对象OpenCL 共享虚拟存储器OpenCL 与OpenGL
OpenCL 基础教程
OpenCL 在Windows上搭建开发环境OpenCL 在Linux上搭建开发环境OpenCL 在OS X上搭建开发环境OpenCL 第一个程序OpenCL 平台OpenCL 设备OpenCL 创建上下文OpenCL 创建命令队列OpenCL 创建Program对象OpenCL 编译Program对象OpenCL 查询和管理Program对象OpenCL 创建内核对象OpenCL 设置内核参数OpenCL 查询和管理内核对象OpenCL 执行内核OpenCL 编写内核代码OpenCL 错误处理
OpenCL C特性
OpenCL 地址空间修饰符OpenCL 函数修饰符OpenCL 对象访问修饰符OpenCL 标量数据类型OpenCL 为什么要有矢量数据类型OpenCL 矢量初始化OpenCL 读取和修改矢量分量OpenCL 运算符OpenCL 维度和工作项OpenCL 工作组OpenCL 矢量数据拷贝OpenCL 异步拷贝和预取OpenCL 数学函数OpenCL 公共函数OpenCL 几何函数OpenCL 整数函数OpenCL 关系函数OpenCL 杂项矢量函数OpenCL 同步函数OpenCL 原子函数OpenCL 内建图像读函数OpenCL 内建无采样器图像读函数OpenCL 内建图像写函数OpenCL 内建图像查询函数OpenCL 工作组函数OpenCL 内建管道读/写函数OpenCL 内建工作组管道读/写函数OpenCL 内建管道查询函数OpenCL 设备队列OpenCL Blocks语法OpenCL 设备队列相关函数OpenCL 子内核存储器可见性OpenCL 设备队列的使用示例
OpenCL 存储器对象
OpenCL 存储器对象OpenCL 分配缓冲区对象OpenCL 创建子缓冲区对象OpenCL 图像对象和采样器对象OpenCL 图像对象OpenCL 图像格式描述符OpenCL 图像描述符OpenCL 图像对象查询OpenCL 采样器对象OpenCL 主机端采样器对象OpenCL 设备端采样器对象OpenCL 图像旋转示例OpenCL 管道OpenCL 创建管道对象OpenCL 管道对象查询OpenCL 主机与设备间数据传输OpenCL 图像对象主机与设备间数据拷贝OpenCL 缓冲区对象数据填充OpenCL 图像对象数据填充OpenCL 缓冲区对象间数据传输OpenCL 图像对象和缓冲区对象间数据拷贝OpenCL 缓冲区对象映射OpenCL 图像对象映射OpenCL 解映射OpenCL 共享虚拟存储器OpenCL SVM缓冲创建与释放OpenCL SVM缓冲映射与解映射OpenCL SVM缓冲填充与拷贝OpenCL SVM类型OpenCL SVM特性OpenCL 共享虚拟存储器示例OpenCL 存储器一致性模型OpenCL 存储器次序规则OpenCL 原子操作的存储器次序规则OpenCL 栅栏操作的存储器次序规则OpenCL 工作组函数的存储器次序规则OpenCL 主机端与设备端命令的存储器次序规则OpenCL 关于存储器次序在实际OpenCL计算设备中的实现
OpenCL 同步及事件机制
OpenCL 同步及事件机制OpenCL 主机端的OpenCL同步OpenCL OpenCL事件机制OpenCL 对OpenCL事件的标记和栅栏OpenCL 内核程序中的同步OpenCL 工作组内同步OpenCL 原子操作OpenCL 1.2中的原子操作OpenCL 2.0中的原子操作OpenCL 局部存储器与全局存储器间的异步拷贝OpenCL 工作组间同步
OpenCL 与OpenGL互操作
OpenCL 与OpenGL互操作OpenCL 从一个OpenGL上下文来创建OpenCL上下文OpenCL 使用OpenGL共享的缓存对象OpenCL 使用OpenGL纹理数据OpenCL 共享OpenGL渲染缓存OpenCL 从一个OpenCL存储器对象查询OpenGL对象信息OpenCL 访问共享对象的OpenCL与OpenGL之间的同步OpenCL AMD Cayman架构GPUOpenCL AMD GCN架构的GPUOpenCL NVIDIA CUDA兼容的GPUOpenCL NVIDIA GPU架构的执行模型OpenCL NVIDIA GPU的全局存储器OpenCL NVIDIA GPU的局部存储器OpenCL ARM Mali GPU硬件架构OpenCL ARM Mali GPU存储器层次OpenCL ARM Mali GPU OpenCL映射