1

在以下示例中, Visual StudiothreadIdx用红线突出显示“”。

看起来程序执行成功了,所以问题只是VisualStudio中的显示问题。

如何使 Visual Studio 不再突出显示threadIdx为无效?

我的环境: * 操作系统:Windows7,64bit * VisualStudio2010, CUDA5.5


源代码:

 #include <cuda_runtime.h>
 #include <stdio.h> 
 #include <math.h> 
 #include <cuda.h> 


 #define N 256
 __global__ void matrix_vector_multi_gpu_1_256(float *A_d, float *B_d, float *C_d);
 int main(){
    int i,j;
    float A[N], B[N*N], C[N];
    float *A_d, *B_d, *C_d;

    dim3 blocks(1,1,1);
    dim3 threads(256,1,1);

    for(j=0;j<N;j++){
       for(i=0;i<N;i++){
        B[j*N+i]=((float)j)/256.0;
        }
    }

    for(j=0;j<N;j++){
       C[j]=1.0F;
    }

    cudaMalloc((void**)&A_d, N*sizeof(float));
    cudaMalloc((void**)&B_d, N*N*sizeof(float));
    cudaMalloc((void**)&C_d, N*sizeof(float));

    cudaMemcpy(A_d,A,N*sizeof(float),cudaMemcpyHostToDevice);
    cudaMemcpy(B_d,B,N*N*sizeof(float),cudaMemcpyHostToDevice);
    cudaMemcpy(C_d,C,N*sizeof(float),cudaMemcpyHostToDevice);

    matrix_vector_multi_gpu_1_256<<<blocks,threads>>>(A_d,B_d,C_d);
    cudaMemcpy(A,A_d,N*sizeof(float),cudaMemcpyDeviceToHost);

    for(j=0;j<N;j++){
        printf("A[ %d ]=%f \n",j,A[j]);
    }
    getchar();

    cudaFree(A_d);
    cudaFree(B_d);
    cudaFree(C_d);
    return 0;
 }

 __global__ void matrix_vector_multi_gpu_1_256(float *A_d, float *B_d, float *C_d){
     int i;

     A_d[threadIdx.x]=0.0F; 
        for(i=0;i<N;i++){
             A_d[threadIdx.x]=A_d[threadIdx.x]+B_d[threadIdx.x*N+i]*C_d[i];
        }
 }
4

1 回答 1

5

尝试添加

#include <device_launch_parameters.h>
于 2013-10-17T14:32:59.113 回答