我在GPU上做一个项目,我必须使用atomicAdd()来做double,因为cuda不支持double,所以我使用下面的代码,这是NVIDIA提供的。
__device__ double atomicAdd(double* address, double val)
{
unsigned long long int* address_as_ull =
(unsigned long long int*)address;
unsigned long long int old = *address_as_ull, assumed;
do {
assumed = old;
old = atomicCAS(address_as_ull, assumed,
__double_as_longlong(val +
__longlong_as_double(assumed)));
} while (assumed != old);
return __longlong_as_double(old);
}
现在我想知道为什么该工具需要一个循环,而(假设!=旧)