1

我开始编写模拟并决定尝试使用更面向对象的方法。因此,我还决定在 CUDA 内核中使用模板参数,该参数指示模拟的空间维度。问题是,由于在头文件中实现模板函数的限制,我不得不使用一种复杂的方法来保持内核包装器可以从 .cpp 源文件中调用。

我的方法是重载 2 维和 3 维的包装函数。然后我有一个用于处理初始化和管理内核资源的包装类。不幸的是,由于我提到的限制,我必须为模板类保留两个成员,即


struct kernelWrapper{
    KernelWrapper(Simulation<2> *simulation):
        d_(2),
        simulation2d_(simulation)
    {}
    KernelWrapper(Simulation<3> *simulation):
        d_(3),
        simulation3d_(simulation)
    {}
    process(void){ //wrapper function for kernel launching
        switch(d_){
        case 2:
            kernel<2><<<..., ...>>>(...);
            break;
        }
        case 3:
            kernel<3><<<..., ...>>>(...);
            break;
        }
        default:
            break;
    }

    int d_;
    union{
        Simulation<2> *simulation2d_;
        Simulation<3> *simulation3d_;
    };
    union{
        Lattice<2> *lattice2d_d;
        Lattice<3> *lattice3d_d;
    };

};

因此,我想知道您是否知道一种更好的方法来实现我想要做的事情,即为模板 CUDA 内核制作一个包装器。

更新:我想添加一个我在发表上述帖子后发现的解决方案。正如C++ 常见问题解答(第 13-15 点)所示,可以将模板实现放在源文件中,并显式实例化所需的模板,即在我的情况下为 2 维和 3 维。使用 C++11,可以更进一步,extern在模板定义中引入关键字以节省一些编译/链接时间,这里也有解释。

4

1 回答 1

3

问题是,由于在头文件中实现模板函数的限制,我不得不使用一种复杂的方法来保持内核包装器可以从 .cpp 源文件中调用。

在 .cpp 中编写模板声明的代码是合法的

无论kernelWrapper是在 .hpp 还是 .cpp 你应该有一个看起来像

template<int d_>
struct kernelWrapper
{
    KernelWrapper(Simulation<d_> *simulation) : simulation_(simulation)
    {}

    process(void)
    {
            kernel<d_><<<..., ...>>>(...);
    }

    Simulation<d_>* simulation_;
    Lattice<d_>*    lattice2d_;
};

还要避免使用 switch/case 来选择内核,使用类似:

int const max_dimension = 4;

template<int static_dimension>
void select_kernel(int dynamic_dimension)
{
    if(dynamic_dimension == static_dimension)
    {
        call_kernel<static_dimension>();
    }
    select_kernel<static_dimension+1>(dynamic_dimension);
}

template<>
void select_kernel<max_dimension>(int dynamic_dimension)
{
    // error message
}

void select_kernel(int dynamic_dimension)
{
    select_kernel<1>(dynamic_dimension);
}

如果这种选择很频繁,那么不使用模板是有意义的。

于 2013-08-25T20:36:30.533 回答