我正在编写一个程序,它使用 cuda 进行一些基本的对象检测。我遇到了一个问题,我用 cudaMallocManaged 分配统一内存,用它做一些处理,然后用 cudaFree 释放它。尽管事件,cudaFree 从未返回错误,内存似乎从未真正被释放,因为任务管理器显示系统内存使用量和 gpu 共享内存使用量都在不断增加。我对统一内存的理解是否存在根本性错误,或者这是一个错误?
最小的例子:
#include "cuda_runtime.h"
#include "device_launch_parameters.h"
#include <cassert>
int main()
{
while (1)
{
void* ptr;
cudaMallocManaged(&ptr, 1 << 20);
assert(cudaFree(ptr) == cudaSuccess);
}
}
我使用的是 Windows 10,cuda 版本是 10.2,驱动版本是 26.21.14.4122。