我和一些同行正在开发一款游戏(Rigs ofRods),并试图将 OpenCL 集成到物理计算中。同时,我们正在尝试对我们的数据结构进行一些急需的清理。我想我应该说我们正在尝试清理我们的数据结构并注意 OpenCL 的要求。
使用开放 CL 的问题之一是无法使用指针,因为内存空间不同。据我所知,OpenCL 是将所有数据复制到 GPU 上,然后执行计算,指针值将被复制,但地址与预期地址不对应。
有问题的数据集中在一个数组中,当对象需要该数据时,它们使用指向所需对象的指针,或存储数组索引。
考虑 OpenCL 的一种解决方案是使用数组索引而不是指针。这会导致硬耦合,这可能会在以后导致头痛。作为一种解决方案,我想到了根据起始地址和当前地址计算数组索引。这当然只适用于连续数组。
我编写了一个示例应用程序来测试它,它工作得很好,有些人也在不同的平台上对其进行了验证。
#include <iostream>
typedef struct beam_t
{
unsigned int item;
} beam_t;
#define GLOBAL_STATIC_ASSERT(expr, msg) \
extern char STATIC_ASSERTION__##msg[1]; \
extern char STATIC_ASSERTION__##msg[(expr)?1:2]
#ifdef __amd64
typedef unsigned long pointer_int;
#else
typedef unsigned int pointer_int;
#endif
GLOBAL_STATIC_ASSERT(sizeof(pointer_int) == sizeof(pointer_int*), integer_size);
#define MAX_BEAM 5
int main ()
{
beam_t beams[MAX_BEAM];
beam_t* beam_start = &beams[0];
beam_t* beam_ptr = NULL;
std::cout << "beams: " << &beams << "\n";
for( pointer_int i = 0; i < MAX_BEAM; ++i )
{
beam_ptr = &beams[i];
pointer_int diff = ((pointer_int)beam_ptr - (pointer_int)beam_start);
std::cout << "beams[" << i << "]: " << beam_ptr
<< "\t calculated index:" << diff / sizeof(beam_t)
<< "\n";
}
return 0;
}
我担心这更像是一个杂乱无章的解决方案。我知道这在没有非连续记忆的情况下是行不通的。
基本上我的问题是这样的:
在已知的连续记忆中使用这种方法会有什么陷阱?
你怎么能说它是连续的?
人们在处理此类问题时使用了哪些方法?
谢谢,如果格式关闭,我很抱歉,这是我第一次发布问题。