0

我知道“cudaHostAlloc”分配的固定内存可以比“malloc”内存更有效地传输到设备。但是,我认为“cudaHostAlloc”只能由 cuda 编译器编译。我的场景是在没有 cuda 编译器的情况下使用 cublas API,而且似乎 cublas 没有提供手册中用于固定内存分配的功能,或者我错过了一些东西......

4

1 回答 1

3

cudaHostAlloc()在 CUDA 运行时 API 中实现。您无需使用 nvcc 进行编译即可使用 CUDA API 调用,您只需包含适当的头文件(例如 cuda_runtime_api.h)并与运行时库(cudart)链接即可。

于 2012-11-01T17:38:50.073 回答