3

我和一些同行正在开发一款游戏(Rigs ofRods),并试图将 OpenCL 集成到物理计算中。同时,我们正在尝试对我们的数据结构进行一些急需的清理。我想我应该说我们正在尝试清理我们的数据结构并注意 OpenCL 的要求。

使用开放 CL 的问题之一是无法使用指针,因为内存空间不同。据我所知,OpenCL 是将所有数据复制到 GPU 上,然后执行计算,指针值将被复制,但地址与预期地址不对应。

有问题的数据集中在一个数组中,当对象需要该数据时,它们使用指向所需对象的指针,或存储数组索引。

考虑 OpenCL 的一种解决方案是使用数组索引而不是指针。这会导致硬耦合,这可能会在以后导致头痛。作为一种解决方案,我想到了根据起始地址和当前地址计算数组索引。这当然只适用于连续数组。

我编写了一个示例应用程序来测试它,它工作得很好,有些人也在不同的平台上对其进行了验证。

#include <iostream>

typedef struct beam_t
{
 unsigned int item;
} beam_t;

#define GLOBAL_STATIC_ASSERT(expr, msg)   \
  extern char STATIC_ASSERTION__##msg[1]; \
  extern char STATIC_ASSERTION__##msg[(expr)?1:2]


#ifdef __amd64
typedef unsigned long pointer_int;
#else
typedef unsigned int pointer_int;
#endif
GLOBAL_STATIC_ASSERT(sizeof(pointer_int) == sizeof(pointer_int*), integer_size);
#define MAX_BEAM 5


int main ()
{
 beam_t beams[MAX_BEAM];
 beam_t* beam_start = &beams[0];
 beam_t* beam_ptr = NULL;

 std::cout << "beams: " << &beams << "\n";

 for( pointer_int i = 0; i < MAX_BEAM; ++i )
 {
  beam_ptr = &beams[i];
  pointer_int diff = ((pointer_int)beam_ptr - (pointer_int)beam_start);
  std::cout << "beams[" << i << "]: " << beam_ptr
      << "\t calculated index:" <<  diff / sizeof(beam_t)
      << "\n";
 }
 return 0;
}

我担心这更像是一个杂乱无章的解决方案。我知道这在没有非连续记忆的情况下是行不通的。

基本上我的问题是这样的:
在已知的连续记忆中使用这种方法会有什么陷阱?
你怎么能说它是连续的?
人们在处理此类问题时使用了哪些方法?

谢谢,如果格式关闭,我很抱歉,这是我第一次发布问题。

4

3 回答 3

13

这应该为您提供pointer相对于的索引base

pointer - base

是的,就是这么简单。=]

用于ptrdiff_t便携式存储结果。

于 2009-09-20T19:09:00.210 回答
3

尽管简单的指针减法有效,但建议使用std::distance. 这也适用于不是指针的迭代器类型,也可以为自定义类型重载。对于指针,结果将是一个ptrdiff_t.

于 2009-09-20T20:26:40.180 回答
1
#define ARRAY_INDEX_FROM_ADDR(base, addr, type) \
(((uintptr_t)(addr)-(uintptr_t)(base))/sizeof(type))

如果不使用 C99,请使用unsigned long long代替uintptr_t

于 2014-01-30T08:22:42.967 回答