1

要充分利用使用 sm_21 架构的支持 CUDA 的 GPU,需要使用向量数据类型(如 uint2)编写内核。

想象一下内核中的一行如下所示:

uint2 a = make_uint2 (123);

这工作正常。值 123 存储到 ax 和 ay 但读取写入很烦人,尤其是当您必须编写大型代码块并初始化大量变量时。

我习惯于编写纯 C 代码,所以我不是 C++ 极客。也许我正在寻找的东西很简单。

我知道有可能“重载”一个操作员。我的问题是:是否也可以重载赋值运算符?

我试过这个:

inline __device__ uint2 operator = (int a)
{
  return make_uint2 (a, a);
}

但它失败并显示错误消息:

错误:“operator=”必须是成员函数

任何人?

4

1 回答 1

4

可以重载赋值运算,但是(正如错误消息告诉您的那样)它必须是成员函数。这意味着要使用它,您必须创建一个类来充当uint2. 但是,当您这样做时,很有可能您实际上不需要/不想重载operator=——相反,您只需创建一个 ctor,它从 a 创建包装器的实例,uint2另一个从int. 这些将用于根据您提供的值创建包装器的实例,并且该临时实例将分配给目标。代码看起来像这样:

class uint_2 {
    uint2 value;
public:
    uint_2(uint2 init) : value(init) {}
    uint_2(int init) : value(make_uint2(init)) {}

    operator uint2() { return value; }
};

特别是考虑到您使用的是 CUDA,可能会出现有关效率的问题,所以我会提前解决它们:在正常情况下,这可能不会产生任何开销。但是,我不太确定 CUDA 的情况,以及您是否能够(例如)__device__在上面的代码中使用。我的直接猜测可能不是,但老实说我真的不知道——几年前我写了一点CUDA 代码,当时它还是新的,但我很确定我从未尝试过。我怀疑我肯定不会更新规则,但如果我这样做了,我就不再记得它们了。

于 2012-04-13T14:54:34.440 回答