CMake 实际上提供了这样的自动检测功能,但是:
- 它没有记录(并且可能会在将来的某个时候被重构)。
- 它是已弃用的 FindCUDA 机制的一部分,旨在直接操纵
CUDA_CMAKE_FLAGS
(这不是我们想要的)。
- 它不会“玩得很好”,并且对我们隐藏了有用形式的内部变量。
尽管如此,只要稍微加点肘部油脂,我们就可以让它发挥作用。
首先,它的位置:它在一个模块中,FindCUDA/select_compute_arch
(在 Linux 系统上,它位于/path/to/cmake/root/share/cmake-X.YY/Modules/FindCUDA/select_compute_arch.cmake
)。
现在这里是你如何使用它:
include(FindCUDA/select_compute_arch)
CUDA_DETECT_INSTALLED_GPUS(INSTALLED_GPU_CCS_1)
string(STRIP "${INSTALLED_GPU_CCS_1}" INSTALLED_GPU_CCS_2)
string(REPLACE " " ";" INSTALLED_GPU_CCS_3 "${INSTALLED_GPU_CCS_2}")
string(REPLACE "." "" CUDA_ARCH_LIST "${INSTALLED_GPU_CCS_3}")
SET(CMAKE_CUDA_ARCHITECTURES ${CUDA_ARCH_LIST})
如果您只想将其用于单个目标,则将最后一行替换为:
set_property(TARGET my_target PROPERTY "${CUDA_ARCH_LIST}")
笔记:
当您的系统上没有GPU 时,您可能会得到如下结果:3.5;5.0;5.3;6.0;6.1;7.0;7.5;7.5+PTX
.
这是CMake 的一个问题,无法解决,因为我们在这里使用的子模块不受官方支持。因此,如果您需要在没有 GPU 的系统上进行编译,请避免此调用或解析“+PTX”条目的结果。
子模块已经存在了更长的select_compute_arch
时间,但在过去你会以不同的方式使用它,并将它包含在include(FindCUDA)
.
我想知道是否LIST(APPEND CMAKE_CUDA_ARCHITECTURES
可能不比SET(CMAKE_CUDA_ARCHITECTURES
.
请参阅 CMake 问题22375和19199,了解 CMake 未来可能会采用的方式。警告:我提交了那些错误......