CUDA 驱动程序 API 提供从文件系统加载包含 PTX 代码的文件。通常会执行以下操作:
CUmodule module;
CUfunction function;
const char* module_file = "my_prg.ptx";
const char* kernel_name = "vector_add";
err = cuModuleLoad(&module, module_file);
err = cuModuleGetFunction(&function, module, kernel_name);
如果在运行时(即时)生成 PTX 文件,则通过文件 IO 似乎是一种浪费(因为驱动程序必须再次加载它)。
有没有办法将 PTX 程序直接传递给 CUDA 驱动程序(例如作为 C 字符串)?