c++ - 如何使用 CUDA 驱动程序函数？

Question

我有一个带有生产者线程和 OpenGL 线程的 GUI 应用程序，OpenGL 线程需要调用 CUDA 函数，生产者需要调用cudaMemcpy等。

无论我做什么，我似乎都无法让 CUDA 驱动程序 api 工作。每次我尝试使用这些功能时，我都会得到一个cudaErrorMissingConfiguration.

我想使用多线程 CUDA，实现此目的的典型方法是什么？

原来的

void program::initCuda()
{
    CUresult a;pctx=0;
    cudaSafeCall(cudaSetDevice(0));
    cudaSafeCall(cudaGLSetGLDevice(0));
    a=cuInit(0);
    cudaSafeCall(cudaFree(0));
    cout <<"cuInit :" <<a << endl;assert(a == cudaSuccess);
    //a=cuCtxGetCurrent(pctx);
    a=cuCtxCreate(pctx,CU_CTX_SCHED_AUTO,0);
    cout <<"GetContext :" <<a << endl;assert(a == cudaSuccess);
    //Fails with cudaErrorMissingConfiguration
    a=cuCtxPopCurrent(pctx);
    cout <<"cuCtxPopCurrent :" <<a << endl;assert(a == cudaSuccess);
    cout <<"Initialized CUDA" << endl;
}

修改

void glStream::initCuda()
{
    CUresult a;
    pctx=0;
    cudaSafeCall(cudaSetDevice(0));
    cudaSafeCall(cudaGLSetGLDevice(0));
    cudaFree(0);// From post http://stackoverflow.com/questions/10415204/how-to-create-a-cuda-context seems to indicate that `cudaSetDevice` should make a context.
    a=cuCtxGetCurrent(pctx);
    cout <<"GetContext :" <<a << endl;assert(a == cudaSuccess);
    a=cuCtxPopCurrent(pctx);
    cout <<"cuCtxPopCurrent :" <<a << endl;assert(a == cudaSuccess);
    cout <<"Initialized CUDA" << endl;
}

score 3 · Accepted Answer

第二个代码的最简单版本应如下所示：

#include <iostream>
#include <assert.h>
#include <cuda.h>
#include <cuda_runtime.h>

int main(void)
{
    CUresult a;
    CUcontext pctx;
    cudaSetDevice(0); // runtime API creates context here
    a = cuCtxGetCurrent(&pctx);
    std::cout << "GetContext : " << a << std::endl;
    assert(a == CUDA_SUCCESS);
    a = cuCtxPopCurrent(&pctx);
    std::cout << "cuCtxPopCurrent : " << a << std::endl;
    assert(a == CUDA_SUCCESS);
    std::cout << "Initialized CUDA" << std::endl;

    return 0;
}

在带有 CUDA 5.0 的 OS X 10.6 上产生以下结果：

$ g++ -I/usr/local/cuda/include -L/usr/local/cuda/lib driver.cc -lcuda -lcudart
$ ./a.out
GetContext :0
cuCtxPopCurrent :0
Initialized CUDA

IE。“只是工作”。这里的上下文是由调用延迟启动的cudaSetDevice（注意我错误地断言cudaSetDevice没有建立上下文，但至少在 CUDA 5 中它似乎如此。当在 CUDA 4 中修改运行时 API 时，这种行为可能已经改变）。

或者，您可以使用驱动程序 API 来启动上下文：

#include <iostream>
#include <assert.h>
#include <cuda.h>
#include <cuda_runtime.h>

int main(void)
{
    CUresult a;
    CUcontext pctx;
    CUdevice device;
    cuInit(0);
    cuDeviceGet(&device, 0);
    std::cout << "DeviceGet : " << a << std::endl;
    cuCtxCreate(&pctx, CU_CTX_SCHED_AUTO, device ); // explicit context here
    std::cout << "CtxCreate : " << a << std::endl;
    assert(a == CUDA_SUCCESS);
    a = cuCtxPopCurrent(&pctx);
    std::cout << "cuCtxPopCurrent : " << a << std::endl;
    assert(a == CUDA_SUCCESS);
    std::cout << "Initialized CUDA" << std::endl;

    return 0;
}

这也“有效”：

$ g++ -I/usr/local/cuda/include -L/usr/local/cuda/lib driver.cc -lcuda -lcudart
$ ./a.out
DeviceGet : 0
CtxCreate : 0
cuCtxPopCurrent : 0
Initialized CUDA

你不应该做的是在你的第一个例子中混合两者。我所能建议的就是尝试这两种方法并确认它们对您有用，然后将调用序列用于您实际尝试实现的任何目标。

c++ - 如何使用 CUDA 驱动程序函数？

1 回答 1

Related

Reference