-1

我有一个 42000(行)* 110000(维度)的 numpy 数组,我正在尝试创建一个具有 32GB 内存和 8 个内核的成对距离矩阵(42000*42000)。

我尝试了 pairwise_distances_chunked 但它只给出 3120*42000 距离矩阵。也使用了 pairwise_distances 但它给出了内存不足的错误。

有什么建议可以做什么?

4

1 回答 1

2

阅读 pairwise_distances_chunked 的文档,它一次产生一个块。根据您提出问题的方式,您似乎是这样做的:

D_chunk = next(pairwise_distances_chunked(X))

该代码(这是文档中的第一个示例)只为您提供了第一个块。

你想要做的是:

for chunk in pairwise_distances_chunked(X):
    do_something(chunk)
于 2019-09-12T15:43:37.633 回答