0

我在我的 caffe 程序中使用 cudnn 加速。我在开始时使用 cudnn 4,它工作正常,但是当我将 cudnn 更新到 5.0 版时,pow 函数不起作用。调用函数在 batch_norm 层中为

caffe_gpu_powx(variance_.count(), variance_.gpu_data(), Dtype(0.5), variance_.mutable_gpu_data());

并且调用后的数据没有变化。pow 函数定义如下,与 caffe github banch 中的相同

template <typename Dtype>
\__global__ void powx_kernel(const int n, const Dtype* a,
    const Dtype alpha, Dtype* y)
 {
     CUDA_KERNEL_LOOP(index, n)
     {           
         y[index] = pow(a[index], alpha);  
     }  
}

template <>
void caffe_gpu_powx<float>(const int N, const float* a,
    const float alpha, float* y) {
    // NOLINT_NEXT_LINE(whitespace/operators)
    powx_kernel<float><<<CAFFE_GET_BLOCKS(N), CAFFE_CUDA_NUM_THREADS>>>(
      N, a, alpha, y);
}
4

1 回答 1

1

我犯了一个错误,我在 TITAN X 开始时将代码生成设置为“compute_52,sm_52”,但现在应该将较低的 GPU 设置为“compute_20,sm_20”。它现在工作正常。

于 2016-11-10T08:39:10.683 回答