1

当用 C 告诉我的电脑时

printf("%d",(int)-1);

我确实期望并且通常也会得到“-1”响应。然而,在我的 Tesla M2090 Nvidia Card 上,我的基于 Ubuntu 的 Cuda 5.0 与这个无辜的演示程序通话

/** cheese.cu */
#include <iostream>
#include <cuda.h>
#include <cstdio>

using namespace std;

template<typename T> struct SpacePtr
  { size_t size; T* ptr; };

 __global__ void f(SpacePtr<int>* sp)
{
  printf("This _is_ a 'minus one' or ain't it: %d\n",(int)-1);
  // Note: All appears to work fine with %lu instead of %zd
  // Still: How does the size value affect the -1?
  printf("On DEV: Size: %zd, Minus One: %d\n",sp->size,(int)-1);
}

int main()
{
  SpacePtr<int> data; data.ptr = 0; data.size = 168;
  SpacePtr<int>* devPtr = 0;
  cudaMalloc(&devPtr,1);
  cudaMemcpy(devPtr,&data,sizeof(SpacePtr<int>),cudaMemcpyHostToDevice);
  f<<<1,1,0,0>>>(devPtr);
  cudaError_t err = cudaGetLastError();
  cout << "The last error code was " << err << " (" <<
    cudaGetErrorString(err) << ")" << endl;
  cudaDeviceSynchronize();
}

通过编译和调用

nvcc -arch=sm_20 cheese.cu && ./a.out

产生输出:

The last error code was 0 (no error)
This _is_ a 'minus one' or ain't it: -1
On DEV: Size: 168, Minus One: 10005640

最后一个数字实际上是某种随机数(两个后续调用返回不同的结果),就好像内存分配有问题一样。-1 之前的 (int) 已经是反复试验。原始程序没有它。

这里有一个问题:有人知道为什么没有写-1,如果是这样,你能告诉我为什么吗?非常感谢,马库斯。

4

2 回答 2

6

如果查看CUDA C 编程指南的附录 B.32.1“格式说明符”,您会发现不支持z修饰符 in 。%zd您必须转换为unsigned long%lu用作格式说明符:

printf("On DEV: Size: %lu, Minus One: %d\n",(unsigned long)(sp->size), (int)-1);
于 2013-03-04T10:04:31.240 回答
2

基本问题似乎%zd是设备 printf 不支持格式说明符(我不确定是否支持它)。

编辑:

CUDA 5 中 printf 的文档是这样说的:

对于标准 printf(),格式说明符采用以下形式:%[flags][width][.precision][size]type

支持以下字段(有关所有行为的完整描述,请参阅广泛可用的文档):

Flags: ‘#’ ‘ ‘ ‘0’ ‘+’ ‘-‘
Width: ‘*’ ‘0-9’
Precision: ‘0-9’
Size: ‘h’ ‘l’ ‘ll’
Type: ‘%cdiouxXpeEfgGaAs’

请注意,CUDA 的 printf() 将接受标志、宽度、精度、大小和类型的任何组合,无论它们总体上是否构成有效的格式说明符。换句话说,“%hd”将被接受,并且 printf 将期望参数列表中相应位置的双精度变量。

所以不支持%zd格式说明符。size_t像这样修改你的内核:

__global__ void f(SpacePtr<int>* sp)
{
    const int minus_one = -1;
    printf("This _is_ a 'minus one' or ain't it: %d\n", minus_one);
    printf("On DEV: Size: %d, Minus One: %d\n",int(sp->size), minus_one);
}

工作正常。

另请注意,您的主机代码中有一个相当大的错误,尽管这不会对您示例中的清单行为产生任何影响。您只是分配和复制一个dev_ptr明显不正确的字节。它应该看起来像:

cudaMalloc((void **)&devPtr, sizeof(data));
cudaMemcpy(devPtr, &data, sizeof(data), cudaMemcpyHostToDevice);

将数据的全部内容从主机传输到设备。

于 2013-03-04T10:04:20.623 回答