0

所以我有一个数据框df,它基本上是一个 id 和坐标列表,我想从中得到距离矩阵。
代码运行良好,直到我创建了一个更大的df,大小为 (337644, 2)
注意:使用 64 位机器和 32GB RAM

df2是出现错误的距离矩阵


df = pd.DataFrame(list_coordinates_int, columns=['xcord', 'ycord'], index=list_id)
df2= pd.DataFrame(distance_matrix(df.values, df.values), index=df.index, columns=df.index)

我收到以下错误:

result = np.empty((m,n),dtype=float) # FIXME:找出最好的 dtype

ValueError:数组太大;arr.size * arr.dtype.itemsize大于最大可能大小。

运行代码时我的 RAM 没有完全消耗,所以我不确定这里有什么问题。

4

0 回答 0