我正在尝试使用 C/CUDA 为图像堆栈实现 3D 旋转例程(主要是为了加快计算时间)。我使用 ImageJ 源代码作为代码的基础,因此旋转不是围绕原点自由旋转,而是沿着轴旋转。不过,我遇到了一个有趣的问题。我实现了一个物体绕 Y 轴的旋转,没有什么问题。但是,当我尝试使用非常相似的代码绕 X 轴旋转时,就会出现问题。我注意到在 X 旋转中,有明显的条纹,例如这个例子:
这在我正在做的 Y 旋转中没有发生。
我已经提供了运行以围绕每个轴进行旋转的 CUDA 内核(rotationY 是有效的,rotationX 是提供条带化的)。我想知道是否有人可以就为什么我会遇到一个问题而不是另一个问题提供任何建议,只要它们在实现上非常相似。
编辑:我已将问题缩小到 atomicMin() 无法正常工作。即使正确设置了所有偏移量,zbuffer 也没有正确更改。如果有人知道为什么这可能不起作用,那么很高兴知道。
__global__ void rotationY(int *input, int *projArray, int costheta, int sintheta, int width, int height, int depth, int xcenter, int zcenter,
int projectionwidth, int projectionsize, int *zbuffer, int adjCue, int depthCueSurf, int zmax, int zdiff){
int i=threadIdx.x + blockDim.x*blockIdx.x;
int zcostheta;
int zsintheta;
int offset;
int k, z, point, xnew, znew;
int y=i/width;
int x=i-y*width-xcenter;
int xcostheta = x*costheta;
int xsintheta = x*sintheta;
int offsetinit = y*projectionwidth;
zbuffer[i]=32767;
__syncthreads();
for(k=1; k<=depth; k++){
z = (int)(k-1+.5) - zcenter;
zcostheta = z*costheta;
zsintheta = z*sintheta;
point = i + (k-1)*width*height;
if(input[point]>0){
xnew = (xcostheta + zsintheta)/8192 + xcenter;
znew = (zcostheta - xsintheta)/8192 + zcenter;
offset = offsetinit + xnew;
if (offset<0 || offset>=projectionsize) offset = 0;
atomicMin(&zbuffer[offset],znew);
}
__syncthreads();
if(input[point]>0){
if(znew<=zbuffer[offset]) projArray[offset] = adjCue*input[point]/100+depthCueSurf*input[point]*(zmax-znew)/zdiff;
}
}
}
__global__ void rotationX(int *input, int *projArray, int costheta, int sintheta, int width, int height, int depth, int ycenter, int zcenter,
int projectionsize, int *zbuffer, int adjCue, int depthCueSurf, int zmax, int zdiff) {
int i=threadIdx.x + blockDim.x*blockIdx.x;
int zcostheta;
int zsintheta;
int offset;
int k, z, point, ynew, znew;
int y=i/width;
int x=i-y*width;
y=y-ycenter;
int ycostheta = y*costheta;
int ysintheta = y*sintheta;
zbuffer[i]=32767;
__syncthreads();
for(k=1; k<=depth; k++){
z = (int)(k-1+.5) - zcenter;
zcostheta = z*costheta;
zsintheta = z*sintheta;
point = i + (k-1)*width*height;
if(input[point]>0){
ynew = (ycostheta - zsintheta)/8192 + ycenter;
znew = (ysintheta + zcostheta)/8192 + zcenter;
offset = x + ynew*width;
if (offset<0 || offset>=projectionsize) offset = 0;
atomicMin(&zbuffer[offset], znew);
}
__syncthreads();
if(input[point]>0){
if(znew<=zbuffer[offset]) projArray[offset] = adjCue*input[point]/100+depthCueSurf*input[point]*(zmax-znew)/zdiff;
}
}
}