0

下面的 Thrust 函数可以获得 CUDA 启动 CUDA 5.0 的最大块数,该函数用于 CUSP 中的稀疏矩阵向量乘法 (SpMV),它是一种为持久线程设置执行的技术。第一行是头文件。

#include <thrust/detail/backend/cuda/arch.h>

thrust::detail::backend::cuda::arch::max_active_blocks(kernel<float,int,VECTORS_PER_BLOCK,TH    READS_PER_VECTOR>,THREADS_PER_BLOCK,(size_t)0)

但 CUDA 5.5 不支持该功能。CUDA 5.5 不支持这种技术,还是应该使用其他功能?

4

1 回答 1

2

在任何版本的 Thrust 中,都没有任何支持的方式来执行此计算。命名空间内的标头thrust/detail和标识符detail是 Thrust 实现的一部分——它们不是公共特性。使用它们会破坏你的代码。

也就是说,在这个存储库中有一些实现占用计算器的独立代码:

https://github.com/jaredhoberock/cuda_launch_config

于 2013-11-01T20:53:02.463 回答