我会理解为什么结果是无穷大的。我写了下面的代码,我总是收到 inf 作为结果。我的代码有任何精度问题吗?
#include <stdio.h>
#include <stdlib.h>
#include "cuda.h"
#include "curand_kernel.h"
#define NDIM 30
#define NPAR 5
#define DIMPAR NDIM*NPAR
__device__ double uniform(int index){
return (double) 0.767341;
}
__global__ void iteracao(double *pos){
int thread = threadIdx.x + blockDim.x * blockIdx.x;
double tvel;
int i = 0;
double l, r, t;
if(thread < DIMPAR){
do{
t = (double) uniform(thread);
l = (double) 2.05 * t * ( pos[thread] );
r = (double) 2.05 * t * ( pos[thread] );
tvel = (double) l+t+r;
pos[thread] = tvel;
i++;
}while(i < 10000);
}
}
int main(int argc, char *argv[])
{
double *d_pos, *h_pos;
h_pos = (double *) malloc(sizeof( double ) * DIMPAR);
cudaMalloc((void**)&d_pos, DIMPAR * sizeof( double ));
int i, j, k, numthreadsperblock, numblocks;
numthreadsperblock = 512;
numblocks = (DIMPAR / numthreadsperblock) + ((DIMPAR % numthreadsperblock)?1:0);
//
printf("numthreadsperblock: %i;; numblocks:%i\n", numthreadsperblock, numblocks);
cudaMemset(d_pos, 0.767341, DIMPAR * sizeof( double ));
iteracao<<<numblocks,numthreadsperblock>>>(d_pos);
cudaMemcpy(h_pos, d_pos, DIMPAR * sizeof( double ), cudaMemcpyDeviceToHost);
printf("\n");
for(i = 0; i < NPAR; i++){
for(j = i*NDIM, k = j; j < (k+30); j++){
printf("%f,", h_pos[j]);
}
printf("***\n\n");
}
system("PAUSE");
return 0;
}
输出总是这样的:
numthreadsperblock:512;;数字块:1
inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf, inf,inf,inf,inf,inf, *
inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf, inf,inf,inf,inf,inf, *
inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf, inf,inf,inf,inf,inf, *
inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf, inf,inf,inf,inf,inf, *
inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf,inf, inf,inf,inf,inf,inf, *