0

我在我的项目中使用 dask (2021.3.0) 和 rapids(0.18)。在此,我在 CPU 上执行预处理任务,然后将预处理后的数据传输到 GPU 进行 K-means 聚类。但是在这个过程中,我遇到了以下问题:

1 个工作作业中有 1 个失败:std::bad_alloc:CUDA 错误:~/envs/include/rmm/mr/device/cuda_memory_resource.hpp:69:cudaErrorMemoryAllocation 内存不足(在完全使用 GPU 内存之前它给出了错误,即它是没有完全使用 GPU 内存)

我有一个大小为 40 GB 的 GPU。内存大小 512 GB。

我正在使用以下代码片段:

cluster=LocalCluster(n_workers=1, threads_per_worker=1)
cluster.scale(100)
##perform my preprocessing on data and get output on variable A
# convert A varible to cupy
x = A.map_blocks(cp.asarray)
km =KMeans(n_clusters=4)
predict=km.fit_predict(x).compute()

我也在寻找一种解决方案,以便可以对大于 GPU 内存的数据进行预处理,并且每当 GPU 内存溢出时,溢出的数据就会被传输到临时目录或 CPU 中(就像我们在 dask 中定义临时目录时所做的那样RAM 中有溢出)。

任何帮助都会得到帮助。

4

1 回答 1

1

有几种方法可以运行比 GPU 更大的数据集。

  1. 查看Nick Becker 的博客,其中有一些方法有据可查
  2. 查看BlazingSQL,它建立在 RAPIDS 之上,可以执行核心外处理。您可以在 beta.blazingsql.com 上试用。
于 2021-03-19T18:05:48.560 回答